ثورة الاتصالات؟ يتيح لك نهج جديد حفظ عرض النطاق الترددي 100 مرة أو أكثر مع مكالمات الصوت والفيديو



يتذكر الكثير من الناس أن سلسلة وادي السليكون تحكي عن مبرمج ، ريتشارد
هندريكس ، الذي توصل عن طريق الخطأ إلى خوارزمية ضغط البيانات الثورية وقرر
بناء شركته الخاصة.

حتى أن مستشاري المسلسل اقترحوا مقياسًا لتقييم
مثل هذه الخوارزميات - نقاط ويسمان الوهمية.

علاوة على ذلك ، أجرت الشركة الناشئة دردشة فيديو باستخدام هذا الحل.

المجتمع المحترم مدعو لمناقشة
مبدأ آخر غير معتاد تمامًا لضغط البيانات لمكالمات الصوت والفيديو ، والذي يحل المشكلة من جانب جديد وغير
متوقع.

إذا كنت ترغب في المشاركة في مناقشة هذا الحل ، وكذلك معرفة ما هو مشترك
المفاهيم مع جوناثان سويفت وأعمال ليو تولستوي ، من فضلك ، تحت القط.

جزء من النظرية


دعنا نصف بشكل عام كيف يعمل الاتصال الصوتي الحديث - المبدأ هو نفسه
للمكالمات عبر شبكة GSM ، وكذلك للمراسلة الفورية وشبكات VOIP.

يتم نقل الاهتزازات الصوتية إلى ميكروفون الهاتف الذكي ، ثم إلى محول تناظري إلى رقمي
(ADC أو ADC):



بعد ذلك ، يتم تنفيذ الترميز بواسطة برامج ترميز مختلفة (G711 ، G729 ، OPUS ، GSM ، إلخ) ،
يتم إضافة التشفير أو عدم إضافته (SRTP ، ZPTP ، إلخ). .د.) وإرسالها إلى وسيط
البيانات.

على سبيل المثال ، تستخدم جميع برامج المراسلة الفورية تقريبًا (WhatsApp و Viber وما إلى ذلك) نفس برامج الترميز (مؤخرًا عادة ما تكون Opus) ، وتقريبا نفس
البروتوكولات المعدلة قليلاً (استنادًا إلى SIP و WebRTC).

يمكن أيضًا لشبكة الإنترنت العامة وشبكة GSM أو
الإنترانت أن تعمل كشبكة لنقل البيانات :



يعتبر التشفير عنصرًا اختياريًا في هذا المخطط ، على سبيل المثال ، في معظم الحالات ،
لا يتم استخدام التشفير في مهاتفة SIP.

ولكن في الرسل ، على العكس ، يستخدمون عادة
بروتوكولات الملكية الخاصة بهم لتشفير الصوت والفيديو.

ثم تحدث العملية العكسية - يقوم المستلم ، بعد استلام البيانات ، بفك تشفير المعلومات المستلمة ، ثم تنتقل الإشارة إلى DAC (محول رقمي إلى تمثيلي) ثم تنتقل إلى مضخم الصوت المتصل بالسماعة:



خصائص برامج الترميز الحديثة:

G.711 64 Kb / s.
G.726 16 أو 24 أو 32 أو 40 كيلوبت في الثانية
G.729A 8 كيلوبت / ثانية
GSM 13 كيلوبايت / ثانية
iLBC 13.3 كيلوبت / ثانية (إطار 30 مللي ثانية) ؛ 15.2 كيلوبايت / ثانية (إطار 20 مللي ثانية)
نطاق Speex من 2.15 إلى 22.4 كيلوبت / ثانية.
G.722 64 كيلوبت / ثانية

وبالتالي ، على سبيل المثال ، خلال محادثة مدتها 7 دقائق على WhatsApp أو Skype ، سيتم
استخدام حوالي 1 ميغابايت.

تذكر هذه الأرقام - 1 ميغابايت لمدة 7 دقائق من المحادثة ، سنحتاج إليها قريبًا.

"ليو تولستوي كمرآة ... للثورة ..."


دعونا نتذكر الرواية الأكثر شهرة لهذا الكاتب الروسي العظيم:

"الحرب والسلام" - الرواية الملحمية لليو تولستوي ، التي تصف
المجتمع الروسي في عصر الحروب ضد نابليون في 1805-1812. خاتمة الرواية تصل
بالقصة إلى عام 1820.

رواية "الحرب والسلام" L.N. كرّس تولستوي سبع سنوات من العمل الشاق والشاق ، وتشهد مخطوطات
"الحرب والسلام" على كيفية إنشاء واحدة من أكبر الأعمال في العالم : تم الاحتفاظ بأكثر من 5200 ورقة مكتوبة بدقة في أرشيف الكاتب.


إذا كنت تريد الآن قراءة هذه الرواية ، فيمكن تنزيلها بسهولة.

ويزن هذا الملف فقط ... 1 ميغابايت:



يمكن اعتبار تنسيقات fb2 و epub ، تمامًا مثل zip ، rar ، كنوع من
برامج الترميز.

دعونا نفكر - 7 دقائق من محادثتنا على WhatsApp متساوية في حجم الحركة إلى
عمل رائع تمت كتابته منذ 7 سنوات!

تم ترميز المحادثة لمدة 7 دقائق بواسطة برنامج ترميز opus ، وتم تشفير الرواية بواسطة ePub ، المجلد هو نفسه - 1
ميغابايت ، ولكن يا له من فرق كبير!

رحلات جاليفر


يعلم الجميع هذا العمل الذي قام به جوناثان سويفت منذ الطفولة ، ولكن في الواقع هذا الكتاب ليس
للأطفال.

رحلات جاليفر هي هجاء سياسي للبالغين ، بالطبع في سياق
القرن الثامن عشر.

من المثير للدهشة أن سويفت ، كونه خصمًا متحمسًا له الآخر المعاصر ،
نيوتن ، في رحلات جاليفر له لم يتنبأ فقط باكتشاف أقمار
المريخ (مع وصف دقيق إلى حد ما لخصائصها) ، ولكنه وصف أيضًا
طريقة مثيرة للاهتمام للتواصل بين الناس:

"... المشروع المطلوب الإلغاء الكامل لجميع الكلمات ؛
أشار مؤلف هذا المشروع بشكل رئيسي إلى فوائده الصحية وتوفير
الوقت.

بعد كل شيء ، من الواضح أن كل كلمة نلفظها ترتبط ببعض البلى
, , .

, ,
,
.


.

, ,
,
,
. ,
, .
, , ,
; ,
, .

,
, , ,
. , , ,
,
.

,
كلغة عالمية تفهمها جميع الدول المتحضرة ، لأن الأثاث
والأواني المنزلية متشابهة أو متشابهة جدًا في كل مكان ، لذلك يمكن فهم استخدامه بسهولة.
وهكذا ، يمكن للمبعوثين التحدث بسهولة مع ملوك أو
وزراء أجانب ، لغتهم غير معروفة تمامًا لهم ... "


لذا ، ربما تعرف بالفعل ما أقوده :)

لماذا تبث الصدمات الجوية (الأصوات) لمئات وآلاف الكيلومترات ،
عناء مع التشفير (من أجل إرسال هذه الارتجاجات الهوائية إلى المرسل إليه بأكبر قدر ممكن من الدقة والكفاءة) ، للحفاظ على النطاق الترددي اللازم ، إذا كان
الحمل الدلالي لهذا الإرسال ضئيلًا ، أو حتى يميل إلى الصفر؟

بعد كل شيء ، يتواصل الناس مع بعضهم البعض ليس بالأصوات ، ولكن بالمعنى ، المحتوى ، الدلالات ، الأفكار ...

مفهوم نظام الاتصال الجديد بسيط للغاية - على جانب المصدر
ويتم أيضًا اهتزازات الصوت الرقمية ، ولكن لا يتم نقلها على الفور إلى الجانب الآخر ، ولكن يتم
تحويلها إلى نص (الكلام إلى نص) ثم يتم إرسال النص ذي المعنى من
المشترك أ ، والذي:

  • يمكن إرسالها بالحد الأدنى المطلوب من عرض النطاق الترددي للبيانات (حتى الاتصال اللاسلكي عالي التردد ، إلخ ممكن)
  • يمكن تشفيرها بأي خوارزمية تشفير قوية

على الجانب B ، يتم فك تشفير الرسائل المستلمة وتشغيلها كصوت من
المشترك أ (تحويل النص إلى كلام).

يمكنك أيضًا التنزيل على الجانب B لما يسمى الصورة الرمزية للمشترك أ ، والتي من شأنها أن
تكرر بالضبط طريقة الكلام للمشترك أ

. يمكن لقناة منفصلة أن تنقل ضوضاء الخلفية والعواطف.



كل نفس ينطبق على اتصالات الفيديو - علاوة على ذلك ، كانت العناصر الفردية
موجودة منذ فترة طويلة في التطبيقات (أقنعة متنوعة ، خلفية في Zoom ، إلخ).

نعم ، هناك مشكلات فنية لم يتم تنفيذها بالكامل في الوقت الحالي -
على سبيل المثال ، ستكون سرعة تحويل الكلام إلى نص حرجة ، ولكن باستخدام
خوارزميات تحويل الذكاء الاصطناعي التنبؤية يمكنك زيادة هذه السرعة بشكل كبير.

أهم ميزة هي أن الحد الأدنى المطلوب من عرض النطاق الترددي مطلوب في وسط إرسال البيانات
.

أولئك. يمكن استخدام هذا المبدأ ليس فقط
للاتصالات اليومية العادية ، ولكن أيضًا للجيش والاتصالات بعيدة المدى مع تأخيرات كبيرة
(الاتصالات الفضائية ، الكواكب - القمر ، المريخ ، إلخ :)) على

الرغم من أن هذا وصف للمفهوم ، فهو في الواقع في مشروعنا لعدة
أشهر تم استخدام نموذج أولي مع هذا المبدأ.

ولكن المزيد عن ذلك في المرة القادمة ...

All Articles