通讯革命?一种新方法可让您通过音频和视频通话节省100倍或更多的带宽



许多人记得硅谷的系列讲述了一个程序员Richard
Hendrix,他偶然想到了一种革命性的数据压缩算法,并决定
建立自己的初创公司。

该系列的顾问甚至提出了一种评估
此类算法的指标-虚拟的魏斯曼评分。

进一步,该初创公司使用此解决方案进行了视频聊天。

邀请一个受人尊敬的社区讨论另一个完全不同寻常
的音频和视频通话数据压缩原理,该原理从一个新的,
不可预料的方面解决了这个问题

如果您想参与此解决方案的讨论,并找出它的共同点
乔纳森·斯威夫特(Jonathan Swift)的概念和列夫·托尔斯泰(Leo Tolstoy)的作品,请在猫的照护下进行。

一点理论


让我们笼统地描述现代音频通信的工作原理
-GSM网络上的呼叫以及即时通讯程序和VOIP网络的原理是相同的

声音的振动先传输到智能手机的麦克风,再传输到
模数转换器(ADC或ADC):



接下来,由各种编解码器(G711,G729,OPUS,GSM等)执行编码,
添加或不添加加密(SRTP,ZPTP等)。 .d。)并发送到
数据介质

例如,几乎所有即时通讯程序(WhatsApp,Viber等)都使用相同的编解码器(最近通常是Opus)和几乎相同的略微
修改的协议(基于SIP,WebRTC)。

公共Internet和GSM网络或
Intranet 也可以充当数据传输网络



加密是此方案中的可选元素,例如,在大多数情况下,
SIP电话不使用加密。

相反,在Messenger中,他们通常使用其专有
协议来加密语音和视频。

然后发生相反的过程-接收者已经接收到数据,对接收到的信息进行解码,然后信号进入DAC(数模转换器),然后进入与扬声器相连的音频放大器:



现代编解码器的特性:

G.711 64 Kb / s。
G.726 16、24、32或40 Kbps
G.729A 8 Kb /秒
GSM 13 Kb /秒
iLBC 13.3 Kb /秒 (30毫秒帧);15.2 Kb /秒 (20 ms帧)
Speex范围从2.15到22.4 Kb / s。
G.722 64 Kb /秒

因此,例如,在WhatsApp或Skype上进行7分钟的对话期间,大约会
用完1 MB。

请记住这些数字-1 MB用于7分钟的对话,我们将很快需要它们。

“托尔斯泰是革命的镜子……”


让我们回想起这位伟大的俄罗斯作家最著名的小说:

《战争与和平》-列夫·托尔斯泰的史诗小说,描述
了1805-1812年对拿破仑战争时期的俄罗斯社会。小说的结尾把
故事带到了1820年。

小说《战争与和平》托尔斯泰花了七年的心血和努力,
“战争与和平” 的手稿证明了世界上最大的作品之一是如何被创造的:作者的档案中保存了超过5200张精美的作品


如果您现在想阅读这本小说,则可以轻松下载。

这个文件仅重... 1 MB:



fb2和epub格式,就像zip,rar一样,基本上可以认为是一种
编解码器。

让我们想想-我们在WhatsApp上进行的7分钟对话对于一部
已经撰写7年出色作品而言,在流量上是相等的

7分钟的对话由opus编解码器编码,小说由ePub编码,体积相同
-1MB,但有很大的不同!

格列佛游记


从小就人人都知道乔纳森·斯威夫特的这部作品,但实际上这本书并不适合
儿童使用。

《格列佛游记》是成年人的政治讽刺,当然是在18
世纪的背景下

令人惊讶的是,斯威夫特
在他的《格列佛游记》中热烈反对他的另一当代牛顿,不仅预言了
火星卫星的发现(对其特征进行了相当准确的描述),而且还描​​述了
人与人之间一种相当有趣的交流方式:

“ ...该项目需要完全废除所有词语;
该项目的作者主要提到他的健康益处和节省
时间。

毕竟,很明显,我们发音的每个单词都与一些磨损有关
, , .

, ,
,
.


.

, ,
,
,
. ,
, .
, , ,
; ,
, .

,
, , ,
. , , ,
,
.

,
作为所有文明国家都可以理解的通用语言,因为家具和家用
器具到处都是相同或非常相似的,因此可以很容易地理解其用法。
因此,特使可以轻松地与外国国王或
大臣对话,而他们的语言完全不为他们所用……”


因此,您可能已经猜到我正在领导什么:)

为什么要传播数百千米的空气冲击(声音),这很
麻烦编码(为了将这些空气震荡尽可能准确,高效地发送给收件人),以保持必要的带宽,如果
这种传输的语义负载最小,甚至趋于零?

毕竟,人们之间的交流不是通过声音,而是通过含义,内容,语义,思想……

。新的交流系统的概念非常简单-在源侧,声音
振动也被数字化,但不会立即传递到另一侧,而是
转换为文本(语音转换为文本)然后传输来自
订户A 的有意义的文本,该文本

  • 可以以最小的所需数据带宽进行传输(甚至可以进行HF无线电通信等)
  • 可以使用任何强大的加密算法进行加密

在B端,接收到的消息被解密并作为语音从
订户A 播放(文本到语音)。

您也可以在B侧下载所谓的用户A的语音化身,它将
精确地重复用户A的语音方式。

单独的频道可以传输背景噪音和情绪。



对于视频通信来说,情况都是如此-而且,各个元素
在应用程序中早已存在(各种蒙版,缩放中的背景等)。

是的,有些技术问题目前尚未完全实现
,例如,语音到文本的转换速度至关重要,但是使用
预测性AI转换算法可以显着提高该速度。

最重要的优点是在数据传输介质中需要最小的带宽


那些。这个原理不仅可以用于日常的日常
通讯,还可以用于军事和延迟较大的长途通讯
(太空通讯,行星际-月球,火星等:))

尽管这是对该概念的描述,但实际上在我们的项目中,
使用此原理的原型已使用几个月。

但是下一次更多...

All Articles