神经网络是否梦想着用电钱?

TL; DR:



在广阔的网络中,到处都是材料,手册,现成的解决方案,程序集和其他用于预测加密货币和传统交易所资产价格的东西,用最少的精力就能嗅到快速简便的收入。尽管有不同的人以不同的方式,在不同的平台上和以不同的范式编写它们,但是它们都有一个不变的共同属性- 它们不起作用

为什么?让我们做对。

介绍


让我们结识一下,我的名字叫Denis,在业余时间,我从事人工智能领域的研究,尤其是在人工神经网络领域。


在本文中,我将尝试描述遇到的问题这些问题使新手学习人工神经网络的研究人员在追求财务独立性上花费了几乎零效率的宝贵时间。

我希望在本文的框架内,有可能在材料的复杂性和易于理解之间保持足够的平衡,以使文本对于与该领域无关的人们以及长期从事研究问题的人们都具有一定程度的简单性,可理解性和趣味性。这个行业。我必须立即说,这里将没有公式,而且最小化了特定术语。

我不在Google工作。我没有二十度。我没有在NASA实习。我没有在斯坦福大学读书,对此我感到非常遗憾。但是,我仍然希望我了解我在谈论预测系统时所谈论的内容,与此同时,我与整个加密货币世界(尤其是Cardano项目)紧密相关。

当然,作为从事神经网络的加密爱好者,我不禁走进AI关于加密货币的模糊应用领域。


问题的实质


如前所述,关于该主题的材料似乎太多了,而且看起来很深,并带有示例,以至于您睁大了眼睛。作者们如此确定,他们的实验与前几百种实验不同,因此是成功的,以至于为什么下一篇文章没有以在个人岛上带有“羔羊”的照片结尾,以及与价格预测有关的“ kaggle内核”的作者列表为结尾到比特币,不会重复福布斯清单。

希望在哈布雷(Habré)上有专门针对这些问题的文章。而且,有趣的是,无论发布的地点和语言如何,所有这些文章都以几乎相同的文本结尾:“嗯,结果是相当不错的,一切都差不多了,您只需要收紧一些超参数,一切都会好起来的。”

当然,神经网络理想地表示价格的图表,例如:








.

并且,为了不被推翻,以下是此类文章的示例:

一切如何开始


预测旧价格的想法远非新鲜。实际上,这不仅适用于加密货币。碰巧的是,他们本人离我更近,但所谓的“技术分析”家乡毕竟是传统的交流。根据电影,那些都是穿着昂贵服装的人,但与此同时,他们在自己喜欢的乐队的音乐会上像女孩一样尖叫。

为了从过去看未来,人们发明了大量基于数学统计,概率论,有时甚至是坦率的pareidolia的棘手的振荡器,指示器,信号装置

也许最受欢迎的是寻找数字。十五分钟的阅读互联网,甚至现在在华尔街!如此简单-您只需要找到“巴特·辛普森的头”,“蝴蝶”,“旗帜(不要与楔子相混淆!11)”,“天蓝色落在真空转塔上”,建立许多行,并且相当公开,对您有所帮助!


几乎所有这些解决方案都具有一个小但非常密集和严重的缺点-它们可以完美地捕捉趋势…… 事实之后。而且,如果某项声明不是固定的,而是可预测的,那么它的解释是如此自由,以至于十个人使用相同的指标查看同一张图表,将给出十个独立的预测。而且,这是特征,至少其中之一很可能是正确的!

但是事实也会成立。其余的只会说:“嗯,我们不专心地错误地读取了信号。”

不要误解我。多年来,一个真正的华尔街交易员很有可能会尖叫20次,自杀企图200次,很可能彼此堆叠一堆指标和震荡指标,就像电影《黑客帝国》中的操作员一样,读得有用用足够高的垫子填充的数据,等待成功的交易。我什至承认读者(读者)也知道如何做。我承认,没有一点讽刺。最后,由于某种原因,正在发明,改进这些指标...

现代问题需要现代解决方案!


到2015年,每个人都已经听说过神经网络。罗森布拉特甚至都没有想过会听到多少声音。多亏有负责任的,专业的,精通媒体的人,人类才知道神经网络是人类大脑中最电子的版本,可以无限地发挥潜力,从而更快,更好地完成任何任务,总的来说,我们将通过奇点直接进入视野黑暗的未来。这真幸运。

但是只有一个“但是”。目前,神经网络仅以非常低级的形式存在于保留的数学程序包中,通过MatLabs中的图形为数学家和科学家提供支持。

但是,普及已经完成了它的工作,并且吸引了各个独立程度不同的开发人员对该行业的关注。与普通数学家不同,这些相同的开发人员被赋予了高贵的懒惰态度,他们开始寻求在此问题上进行多个层次抽象的方法,从而使自己和所有人的生活更加轻松,向世界展示了一种非常便捷且高质量的高级工具,例如Keras或FANN。在这种热情下,他们取得了巨大的成功,以至于将神经网络的工作带到了“一劳永逸”的水平,为所有进入奇迹和魔法世界的人开辟了道路。

它是奇迹和魔术,而不是数学和事实。


传奇的诞生


神经网络已经变得可用,紧密并且对每个人都易于使用。认真地讲,FANN实现甚至适用于PHP。而且,它包含在基本扩展列表中

那Keras呢?在10行中,您可以收集递归-卷积网络,而无需了解卷积的工作原理或LSTM与GRU的不同!所有人的人工智能!谁也不要生气!

我认为,在某种程度上,该术语是最残酷的笑话。神经网络输出称为什么?是的预测。预测。神经网络可以预测一个数据。听起来就像您所需要的

高级库的手册可保护用户免受复杂项,矩阵,向量,转换,微积分,这些梯度的数学含义,回归和正则化损失的影响。

而且,最重要的是,它们保护了“具有万能的人脑电子模型”的浪漫形象,免受严酷的现实影响。在这种现实中,神经网络只是一个近似器,粗略地说,无非就是从普通线性分类器进化而来。

但是,从文档清单中组装第一个CIFAR-10求解器时,无需付出任何努力,甚至没有真正了解正在发生的事情,都没关系。心中只有一种想法:


我能说什么,我能说什么,人们是如此安排...


这就是技术奇迹!您只需在输入处给它一些数据,在输出处给它其他数据,但它本身会找到一个连接并学会根据输入预测输出。有多少问题可以解决!可以平衡多少个任务!

如此多的预测有趣的是,其他人通常知道吗?有了这个工具包,我的无限可能!无限!


但是,如果您向神经网络提供来自加密货币交易所/股票交易所/外汇的蜡烛,并在下一时间段退出蜡烛,该怎么办?然后她将学习预测以前的新价值!毕竟,这就是它的目的!神经网络可以预测任何东西,会有数据,而报价历史记录上的数据就是一角钱!哦,灵感,只有片刻,却是如此美丽!

为什么不?


因为在与媒体创造的世界不同的现实世界中,它不是那样工作的。神经网络不是预测的机器。神经网络是近似器。很好的逼近器。人们认为神经网络几乎可以近似任何东西。仅存在一个条件-如果它是“某物”,则会使自己趋于近似

然后,新手研究人员陷入了认知失真的陷阱。第一个也是主要的错误是历史报价数据似乎不仅仅是统计数据。在它们上可以画出这么多的三角形和箭头,因为只有盲人注视着这一切并不明显,所有这些都有一定的逻辑,这些逻辑根本无法及时计算。但是机器可能知道。

查看统计数据,一个人看到一个功能陷阱响了。
什么是第二个错误/认知偏见?但是,这就是事情。

它与天气一起工作!


我在加密社区中经常听到这样的论点,在对话中,有关使用统计分析方法从历史数据中预测某些内容的可能性。它随天气而变。失真的本质是“如果A对B有效,但在我看来B与C相同,那么A也应对C有效”。一种伪传递性,在于对B和C之间差异背后的过程的了解不足

。例如,以同样的成功,我们可以假设,飞机自动驾驶舱中飞机驾驶舱内的踏板是刹车和油门,根本不是水平方向盘。不幸的是,对某些事物的直觉并不总是正确的,因为它并不总是依赖于关于情况/系统/对象的相当完整的数据集。嗨,贝叶斯!你好吗?

让我们更深入地了解该理论。

混沌与法则


碰巧,我们现实中的所有过程和事件都可以分为两类:随机性和确定性。当我努力避免沉闷的术语时,让我们用更简单的术语代替它们:不可预测和可预测。


正如欧比万(Obi-Wan)正确地告诉我们的那样,这不是那么简单。事实是,在现实世界中,而不是理论世界中,一切都有些复杂,完全不存在可预测且完全不可预测的过程。最多有准可预测的和准不可预测的。好吧,也就是说,这里几乎是不可预测的且几乎是可预测的。差不多,但是没有。

例如,积雪从顶部到底部大概可以预测到。在几乎100%的情况下。但是不在我的厨房窗户里!由于气流的特点和房屋的形状,那里从下到上下雪。但不总是!同样在几乎100%的情况下,但并非总是如此。有时在我的厨房窗户上,它也会掉下来。看起来这很简单,但是对于同一位观察者,在两种不同的情况下,它们的行为完全不同,尽管这两种行为彼此完全矛盾,但它们都是正常且准可预测的,几率几乎为100%。不错?准可预测的事件竟然是...准不可预测的?更进一步。

这时,我们的朋友贝叶斯开始大笑。不可预测的事件呢?我不会使用前缀“准”,好吗?每个人都已经明白我的意思了。所以在这里。采取一些完全不可预测的事情。布朗运动?完全不可预测的系统的一个很好的例子。是这样吗?让我们问量子物理学家:


事实是,从理论上讲,即使是复杂的系统,如理论上的真实规模的布朗运动,也可以在将来或过去的任何时间建模和预测该系统的状态。理论上。关于为此需要多少计算,能力,时间和牺牲,我们还是保持沉默。

在通常情况下,如果您将范围缩小到特定案例的水平,则可预测的系统将变得不可预测,而如果您将特定案例的观察范围扩展到包括外部因素,从而在这种非常特殊的情况下获得对系统更完整描述,则实际上是可以完全预测的

好吧,事实是,知道特定地方的气流细节,就可以轻松预测雪的飞行方向。了解了特定地点的“浮雕”细节后,便可以预测气流的方向。知道了地形的细节,就可以预测地形的细节。等等等等。同时,我们再次开始放大,但现在是针对特定事件。将其与该事件的行为的“一般”定义分开。有人,阻止贝叶斯,他发动了进攻!

那我们得到什么呢?任何系统都可以同时在某种程度上可预测,而在某种程度上是不可预测的,不同之处仅在于观测范围描述它的初始数据完整性

天气预报和交易所与交易有什么关系?


正如我们先前所发现的,可预测和不可预测系统之间的界线非常狭窄。但是足够强大,可以划定天气预报和贸易的界限。

众所周知,即使是最不可预测的系统实际上也包含完全可预测的片段。要对其建模,就可以减小这些碎片的规模,扩大观察范围,了解模式并对其进行近似,例如使用神经网络。或者推导出一个非常具体的公式,使您可以计算所需的参数。

这就是天气预报和价格预测之间的主要区别-最大的可预测模拟部分的规模。对于天气预报,这些组成部分的规模应使其良好……可以用肉眼从地球轨道上看到它们。借助气象站,还可以在整个星球上实时测量不可见的温度和湿度,例如温度和湿度。对于贸易而言,这种规模……稍后会更多。

旋风不会说“我累了,我要走”,在一个不可预测的时间点突然消失了。行星的特定半球从太阳接收的热量以相同的模式变化。气团在行星尺度上的运动不需要原子模拟,并且在宏观层面上是相当模拟的。一个称为“天气”的系统是在地球上某个特定点的规模上发生的随机事件,在全球范围内更是可以预测的。而且,这些预测的准确性在超过几天的距离上仍然有很多不足之处。该系统尽管可预测,但非常复杂,因此可以在任何时间点以合理的准确性对其进行建模

在这里,我们来谈谈预测模型的另一个重要属性。

预测的自给自足或自治


通常,此属性非常简单-一个自给自足的预测系统或理想的预测系统可以在没有外部数据的情况下完成工作,而无需计算初始状态。

她非常准确。为了预测状态N下的系统属性,对于她来说,获得状态N-1下的计算数据就足够了。知道N的状态,就可以得到N + 1,+ 2,+ m。

这样的系统包括例如任何数学级数。知道了一系列事件中参考点的状态和该点的数量,就可以轻松计算出其他任何点的状态。凉!


这也是为什么天气预报的准确性在很长一段时间内会急剧下降的问题的答案。展望未来,我们不基于系统的实际状态来构建预测,而是基于预测的状态。而且,不幸的是,并非100%的准确性。结果,我们得到了累积预测误差的效果但是尽管有这样一个事实,我们知道几乎所有重要的“变量”,而且对系统的描述几乎可以称为“完整”。

那报价呢?


加上引号,情况就更糟了。事实是,在天气预报中,几乎所有接收和预测的数据都是事件的原因和结果。上一步事件的结果,下一步事件的原因。此外,那些并非既有因果关系的重要数据和事件很可能仅是因果关系而携带着强大的有效载荷。例如,在某个时间点从太阳接收的热量。而且它是不变的。正是这样增加了这种预测的自给自足指标。结果流入下一步的事件原因中。这是完全非马尔可夫过程,可用微分方程来描述。

虽然报价的统计信息主要是结果或50 \ 50。报价的增长会触发报价的进一步增长,并成为原因。而且它可能不会引起和引起。它可能会引起获利了结,并因此导致价格下跌。交易所的历史数据看起来很可靠。数量,价格,“眼镜”,数量众多!其中绝大多数是无济于事的,仅仅是结果,事件和原因的回声,远远超出了这些统计的范围。完全不同的规模。在完全不同的范围内。

在对未来报价进行建模时,我们依靠事件的后果,而不仅仅是购买量的百分比偏差。价格本身并不能决定它本身无法区分。如果将市场表示为一个隐喻的湖泊,则股票图表只是水面上的涟漪。也许是风吹了,也许他们在水中扔了一块石头,也许是鱼溅了出来,也许哥斯拉在蹦床上跳了200公里。我们只看到涟漪。但是在这种涟漪中,我们试图预测4天的风的强度,一个月内将被扔入水中的石头的数量,后天的鱼的心情,或者当哥斯拉厌倦了跳跃时可能走向的方向。他将靠近并再次展开蹦床-涟漪会变得更强!赶上潮流,跳跳!



这是非常重要的一点:
, , , .
换句话说,如果没有足够完整的系统说明,就无法对系统进行足够好的建模。

不幸的是,在市场上,系统的最大可能模拟组件的规模取决于人。甚至对一个人来说,对他的心理状态来说,对市场行为的反应都取决于这种心理状态,而这种反应本身会影响市场。造成后果的原因就在这里!仅需建模成千上万(甚至数百万)独特的个人。有个人问题,感觉,荷尔蒙背景,互动和日常活动。

这不仅涉及全球市场上的交易者。它也涉及特定项目背后的人员。它关系到未来项目的问题和成功。这是关于同一未来的重要事件。事件,有时极其不可预测。事实证明,为了预测未来,我们需要了解未来。


总体而言,我们需要一个观察条件范围,这是我们完全无法获得的。模拟的规模,这对我们来说是完全无法实现的。

好吧,这在理论上当然是可以实现的。从理论上讲,布朗运动也是一个非常模拟且可预测的系统,还记得吗?然后记住实际执行这种模拟的代价。这个价格高得比给神经网络交换蜡烛的过程高。至少在撰写本文时。

但是图形呢?


真。在本文的开头,我们提出了具有极高预测准确性的图表,该图表与100%的地方相邻。

让我们再次看看它们:








你看到了什么?细看。巧合,不是吗?完美,完美。在第一张和第二张图上,神经网络自然领先于报价单!

记住,我提到了用于神经网络的高级库,那么本文中没有任何进展吗?现在得到它。任何事物的广泛可用性,无疑降低了培训普通用户的门槛。神经网络也会发生同样的事情。 “ Kaggle内核”是一个记录。任何非狭窄部分都只是被大量解决方案所掩盖,这些解决方案的作者绝大多数都不知道他们在做什么。从下面开始,每个决定都得到了对这一问题了解甚少的人的赞美言论的支持。 “干得好,您需要什么!”,“很长时间以来,我一直在寻找适合我任务的内核,这就是!以及如何使用它?”等等

在其中找到真正有趣和美丽的东西非常非常困难。
<疯狂的势利>
其结果是,我们有这样一个现象谁容易有一个相当复杂的数学工具进行操作,但人们无法读取图形
</狂躁的势利>

毕竟,X尺度上的时间向右移动,并且最好在事件发生之前获得一个预测

只是超参数还没有扭曲


当我们的神经网络显示出收敛迹象时,我们都会感到高兴。但是有细微差别。在这样的编程中,有一个规则“开始并不意味着赚钱”。当我们刚开始学习编程时,我们对编译器/解释器能够理解我们滑入其中并没有引发错误的事实感到非常满意。在这种形成水平上,我们认为程序中的错误只是语法上的。

在神经网络的设计中,一切都是一样的。收敛不是编译而是编译。它成功了-并不意味着要完全了解我们的需求。那它学到了什么呢?

看着这样漂亮的图形的缺乏经验的研究人员很可能会出来。但是或多或少有经验,很警惕,因为没有太多选择:

  1. 对网络进行了明确的重新培训(在“冗余”的意义上而非“重用”的意义上)
  2. 网络利用了教学方法中的缺陷
  3. 该网络已经逼近了Exchange Grail,并且能够随时预测市场状况,仅用一根蜡烛就能“散布”出无尽的图表

您如何看待,哪个选择更接近现实?不幸的是,不是第三是的,网络真的可以学习。她确实非常准确地给出了结果,但是为什么呢?

尽管人工神经网络不是“人脑的电子模型”,但它们仍具有“思想”的某些特性。基本上,这是“懒惰”和“技巧”。并且在同一时间。这些并不是数百个自我意识的“神经元”出现的后果。这些是以下事实的结果:“优化”一词实际上隐藏在民粹主义术语“教育”之后。

神经网络不是正在学习的学生,至少在撰写本文时,他们正在努力理解我们向他解释的内容。神经网络是一组权重,其值必须以使神经网络的结果相对于参考结果的误差最小化的方式进行调整或优化。

我们给神经网络一个任务,然后要求它“通过考试”。根据“考试”的结果,我们确定其成功程度,正确地认为在准备“考试”的过程中,我们的网络已经获得了足够的知识,技能和经验。

看到了吗?没有?是的,就在表面上!您的目标是教网络实用技能,但您认为其目标是通过考试


不惜任何代价。以任何方式。但是,也许与某些学生相比,她的共同点比前两段中提到的要多。

那么,您如何通过臭名昭著的考试呢?

记住


如此令人难以置信的准确性的可能原因列表中的第一个选项。几乎所有的人工神经网络新手研究人员都知道,其中的神经元越多越好。而且,当其中有许多层时,甚至更好。

但这并没有考虑到神经元和层的数量不仅增加了“抽象思维”领域的网络潜力,而且还增加了其记忆量这一事实。对于循环网络尤其如此,因为它们的存储容量确实非常大。

结果,在最优化过程中,最优化通过考试的选择是……定期填字游戏或“过度拟合”,“过度拟合”。网络只会简单地学习所有的``正确答案''。绝对不了解它们形成的原理。结果,当以前所未有的数据样本测试网络时,网络开始胡扯。

因此,要训练深度/广域网络,您需要更多的数据,需要进行正则化,并且需要控制最小错误阈值,该阈值应该很小,但不要太大。而且,更好的是,在网络规模和解决方案质量之间找到适当的平衡。

好。我们会考虑的。我们将丢弃多余的层。架构得到简化。我们将实施各种不同的技巧。现在可以工作吗?不是事实。毕竟,在简单考试选项列表中排名第二:

智于老师


由于神经网络的分类不是针对过程,而是针对结果,因此实现此结果的过程可能与开发人员的预期略有不同。这是与这些美丽的动物打交道的最邪恶的时刻之一-网络已经学会了,但事实并非如此。

当您看到带有课程预测的图表可以完美地重复实际课程时,请考虑一下您所教的神经网络?超级准确地预测价格?还是像鹦鹉一样重复它们?

确保在训练集上和测试集上具有几乎100%准确性的网络,只需重复其看到的所有内容。预测图在时间上向右移动了一个步骤的网络(图1和图2的示例),只需重复上一步的价格值,然后将价格值传递给新的价格。当然,这些图看起来非常令人鼓舞,并且几乎完全匹配,但是它们没有预测力。您可以自己今天宣布昨天的价格,因此您无需在霍格沃茨学习或抛光Palantir,对吗?

但这是如果您将上一步的值与当前步骤的值进行比较的话。有时人们只是从当前步骤中给出一个值,然后将其与下一步进行比较。在这种情况下,我们将获得与原始图形几乎完美匹配的精美图形(图形3和4的示例)。

有时,您会看到不完全匹配,更柔和,好像平滑,内插的图形。这通常是递归网络试图将新结果与先前结果链接的明显标志(图示例3)。

所有这些结果只有一个共同点-神经网络已学会通过5级以上考试。但是她没有学会按照要求的方式解决分配给她的任务,并且对研究人员没有任何实际的好处。就像学生一样,但附有备忘单,对吗?

网络为什么要重复以前的值,而不尝试生成新的值?是的,仅在培训期间,她就得出一个合理的结论,即通常,图形上与下一个点最近的点是前一个点。是的,在这种情况下,误差的大小是浮动的,但是在较大的样本上,它的大小要稳定地小于尝试在准随机过程中预测下一个状态时的误差的大小

神经网络可以完美地概括。这种概括是解决该问题的绝佳方法。

las,无论您如何扭曲超参数,她的未来都不会打开。图表不会向后退一步。是的,圣杯是如此接近,但到目前为止。


停止。不不不。但是算法交易呢?她存在!


究竟。当然存在。但是关键是这种算法交易与算法占卜不同。算法交易基于这样一个事实,即交易系统当前会分析市场,并基于大量的客观参数和间接符号来决定打开和关闭交易。

是的,从技术上讲,这也是对市场行为进行预测的一种尝试,但是,与提前几天和几个月进行预测不同,交易系统会尝试以最允许的小时间间隔工作。

还记得天气预报吗?还记得它的精度在远距离上会急剧下降吗?它可以双向工作。距离越短,精度越高。您,即使没有气象专家,看着窗外,也可以预测几秒钟内的气温,对吗?

但是它是如何工作的呢?这与所讲的一切不矛盾吗?但是,水面上的涟漪如何?缺少数据又如何呢?毕竟哥斯拉!!

但是不,没有矛盾。只要交易机器人以很小的间隔(从一分钟到几分之一秒)的很小的间隔(取决于类型)工作,它就不需要知道未来,也不需要了解整个市场。对于他来说,了解他周围的系统是如何工作的就足够了。在什么情况下,最好在其中达成交易,然后关闭。交易机器人的规模很小,其视野能够涵盖足够的因素,从而可以在可接受的短距离内做出成功的决策。为此,他绝对不需要知道系统的全局状态。

结论


文章原来很大。超出我的预期。我希望它对某人有用,并有助于节省那些决定尝试自己的运气寻找圣杯的人的时间。

让我们重点说明以下几点:

  1. 哥斯拉有蹦床
  2. 您需要了解解决问题的工具
  3. 因此,有必要了解适用性的限制并充分评估问题的可解决性。
  4. 能够正确解释工具包的结果很重要
  5. 神经网络是函数近似器,而不是未来的预测器
  6. FX=XFXñ=Xñ--1个-这些也是功能
  7. 要模拟系统状态,您需要完整或接近该系统的描述
  8. 统计-仅部分选择性地描述了系统的后果
  9. 一个好的预测系统应适度自给自足
  10. 神经网络无法言表,它们是阴险,狡猾和懒惰的
  11. 想要AI帮助您交易吗?教他交易

感谢所有读完本书的人!

PS不,这不是有关“ VS技术的基本分析”的文章。本文的主题是“没有奇迹”。

All Articles