Kommunikationsrevolution? Mit einem neuen Ansatz können Sie mit Audio- und Videoanrufen 100-mal oder mehr Bandbreite sparen



Viele Menschen erinnern sich, dass die Silicon Valley-Serie von einem Programmierer, Richard
Hendrix, erzählt , der versehentlich einen revolutionären Datenkomprimierungsalgorithmus entwickelt und beschlossen hat
, sein eigenes Startup zu erstellen.

Die Berater der Serie schlugen sogar eine Metrik vor, mit der
solche Algorithmen bewertet werden können - den fiktiven Weissman Score.

Weiter unten in der Handlung führte das Startup mit dieser Lösung einen Video-Chat durch.

Eine angesehene Community ist eingeladen, ein anderes, völlig ungewöhnliches
Prinzip der Datenkomprimierung für Audio- und Videoanrufe zu diskutieren , das das Problem von einer neuen,
unerwarteten Seite löst .

Wenn Sie an einer Diskussion über diese Lösung teilnehmen und herausfinden möchten, was dies gemeinsam hat
Konzepte mit Jonathan Swift und den Werken von Leo Tolstoi bitte unter Kat.

Ein bisschen Theorie


Beschreiben wir allgemein, wie moderne Audiokommunikation funktioniert - das Prinzip gilt für
Anrufe über ein GSM-Netz sowie für Instant Messenger- und VOIP-Netze.

Schallvibrationen werden auf das Mikrofon des Smartphones und dann auf einen Analog-Digital-
Wandler (ADC oder ADC) übertragen:



Anschließend wird die Codierung von verschiedenen Codecs (G711, G729, OPUS, GSM usw.) durchgeführt, die
Verschlüsselung wird hinzugefügt oder nicht hinzugefügt (SRTP, ZPTP usw.). .d.) und an das
Datenträger gesendet .

Beispielsweise verwenden fast alle Instant Messenger (WhatsApp, Viber usw.) dieselben Codecs (in letzter Zeit normalerweise Opus) und fast dieselben leicht
modifizierten Protokolle (basierend auf SIP, WebRTC).

Das öffentliche Internet- und GSM-Netz oder
Intranet kann auch als Datenübertragungsnetz fungieren : Die



Verschlüsselung ist ein optionales Element in diesem Schema. In den meisten Fällen wird die
Verschlüsselung beispielsweise nicht für die SIP-Telefonie verwendet.

Im Gegensatz dazu verwenden Messenger normalerweise ihre proprietären
Protokolle, um Sprache und Video zu verschlüsseln.

Dann erfolgt der umgekehrte Vorgang: Der Empfänger, der die Daten empfangen hat, decodiert die empfangenen Informationen, das Signal geht an den DAC (Digital-Analog-Wandler) und dann an den an den Lautsprecher angeschlossenen Tonverstärker:



Eigenschaften moderner Codecs:

G.711 64 Kb / s.
G.726 16, 24, 32 oder 40 Kbit / s
G.729A 8 Kb / s
GSM 13 Kb / s
iLBC 13,3 Kb / s (30 ms Rahmen); 15,2 Kb / s (20 ms Frame)
Speex-Bereich von 2,15 bis 22,4 Kb / s.
G.722 64 Kb / s

So wird beispielsweise während eines 7-minütigen Gesprächs über WhatsApp oder Skype
etwa 1 MB verbraucht.

Denken Sie an diese Zahlen - 1 MB für 7 Minuten Gespräch, wir werden sie bald brauchen.

"Leo Tolstoi als Spiegel ... der Revolution ..."


Erinnern wir uns an den berühmtesten Roman dieses großen russischen Schriftstellers:

„Krieg und Frieden“ - den epischen Roman von Leo Tolstoi, der die russische
Gesellschaft in der Zeit der Kriege gegen Napoleon zwischen 1805 und 1812 beschreibt. Der Epilog des Romans bringt die
Geschichte bis 1820.

Der Roman "Krieg und Frieden" L.N. Tolstoi widmete sieben Jahre harter und harter Arbeit. Die Manuskripte von
„Krieg und Frieden“ zeugen davon, wie eines der größten Werke der Welt geschaffen wurde : Das Archiv des Schriftstellers enthält über 5.200 fein geschriebene Blätter.


Wenn Sie diesen Roman jetzt lesen möchten, können Sie ihn einfach herunterladen.

Und diese Datei wiegt nur ... 1 MB:



Die Formate fb2 und epub können ebenso wie zip, rar grundsätzlich als eine Art
Codecs betrachtet werden.

Denken wir mal - 7 Minuten unseres Gesprächs über WhatsApp entsprechen dem Verkehrsaufkommen einer
großartigen Arbeit, die seit 7 Jahren geschrieben wurde!

Das Gespräch für 7 Minuten wurde vom Opus-Codec verschlüsselt, der Roman wurde vom ePub verschlüsselt, die Lautstärke ist gleich - 1
MB, aber was für ein großer Unterschied!

Gullivers Reisen


Jeder kennt diese Arbeit von Jonathan Swift seit seiner Kindheit, aber tatsächlich ist dieses Buch nicht für
Kinder.

Gullivers Reisen ist eine politische Satire für Erwachsene, natürlich im Kontext des 18.
Jahrhunderts.

Es ist überraschend, dass Swift, ein leidenschaftlicher Gegner seines anderen Zeitgenossen
Newton, in seinen Gulliver's Travels nicht nur die Entdeckung der
Mars- Satelliten (mit einer ziemlich genauen Beschreibung ihrer Eigenschaften) voraussagte , sondern auch eine ziemlich interessante
Art der Kommunikation zwischen Menschen beschrieb:

„... das erforderliche Projekt die vollständige Abschaffung aller Wörter;
Der Autor dieses Projekts verwies hauptsächlich auf seine gesundheitlichen Vorteile und seine Zeitersparnis
.

Schließlich ist es offensichtlich, dass jedes Wort, das wir aussprechen, mit etwas Verschleiß verbunden ist
, , .

, ,
,
.


.

, ,
,
,
. ,
, .
, , ,
; ,
, .

,
, , ,
. , , ,
,
.

,
Als universelle Sprache, die von allen zivilisierten Nationen verstanden wird, sind Möbel und Haushaltsgegenstände
überall gleich oder sehr ähnlich, so dass ihre Verwendung leicht verständlich ist.
So können Gesandte leicht mit ausländischen Königen oder
Ministern sprechen , deren Sprache ihnen völlig unbekannt ist ... “


Sie wissen also wahrscheinlich bereits, was ich führe :)

Warum Luftschocks (Geräusche) über Hunderte und Tausende von Kilometern übertragen,
stören mit Codierung (um diese Luftkonflikte so genau und effizient wie möglich an den Adressaten zu übertragen), um die erforderliche Bandbreite beizubehalten, wenn die semantische
Last dieser Übertragung minimal ist oder sogar gegen Null tendiert?

Schließlich kommunizieren Menschen nicht mit Tönen, sondern mit Bedeutung, Inhalt, Semantik, Gedanken ...

Das Konzept eines neuen Kommunikationssystems ist recht einfach - auf der Quellenseite. Auch Schallschwingungen
werden digitalisiert, aber nicht sofort auf die andere Seite übertragen, sondern
in Text umgewandelt (Speech To Text). und dann wird der aussagekräftige Text von
Teilnehmer A übertragen , der:

  • kann mit der minimal erforderlichen Datenbandbreite übertragen werden (auch HF-Funkkommunikation usw. ist möglich)
  • kann mit jedem starken Verschlüsselungsalgorithmus verschlüsselt werden

Auf der B-Seite werden die empfangenen Nachrichten entschlüsselt und als Stimme von
Teilnehmer A (Text To Speech) wiedergegeben.

Sie können auch auf der B-Seite der sogenannten herunterladen der Sprachavatar von Teilnehmer A, der die
Sprechweise von Teilnehmer A genau wiederholen würde .

Ein separater Kanal kann Hintergrundgeräusche und Emotionen übertragen.



Gleiches gilt für die Videokommunikation - darüber hinaus gibt
es in Anwendungen seit langem einzelne Elemente (verschiedene Masken, Hintergrund in Zoom usw.).

Ja, es gibt technische Probleme, die derzeit noch nicht vollständig implementiert sind.
Beispielsweise ist die Konvertierungsgeschwindigkeit von Sprache in Text von entscheidender Bedeutung. Mit
prädiktiven AI-Konvertierungsalgorithmen können Sie diese Geschwindigkeit jedoch erheblich erhöhen.

Der wichtigste Vorteil ist, dass im Datenübertragungsmedium eine minimale Bandbreite erforderlich ist
.

Jene. Dieses Prinzip kann nicht nur für die normale alltägliche
Kommunikation verwendet werden, sondern auch für die militärische und Fernkommunikation mit langen Verzögerungen
(Weltraumkommunikation, interplanetarisch - Mond, Mars usw. :))

Obwohl dies eine Beschreibung des Konzepts ist, ist es tatsächlich so In unserem Projekt wurde seit mehreren
Monaten ein Prototyp mit diesem Prinzip verwendet.

Aber mehr dazu beim nächsten Mal ...

All Articles