Träumen neuronale Netze von elektrischem Geld?

TL; DR: Nein



In der Weite des Web ist es voll von Materialien, Handbüchern, vorgefertigten Lösungen, Baugruppen und anderen Dingen, die sich der Prognose der Preise für Kryptowährung und traditionelle Tauschgüter widmen und mit minimalem Aufwand nach schnellen und einfachen Einnahmen riechen. Und obwohl verschiedene Leute sie mit unterschiedlichen Ansätzen, auf unterschiedlichen Plattformen und mit unterschiedlichen Paradigmen schreiben, haben sie alle ein unveränderliches gemeinsames Attribut - sie funktionieren nicht .

Warum? Lass es uns richtig machen.

Einführung


Lernen wir uns kennen, mein Name ist Denis und in meiner Freizeit forsche ich auf dem Gebiet der künstlichen Intelligenz und insbesondere künstlicher neuronaler Netze.


In diesem Artikel werde ich versuchen, die Probleme zu beschreiben, die auftreten, wenn Sie unerfahrene Forscher künstlicher neuronaler Netze im Streben nach finanzieller Unabhängigkeit sind und wertvolle Zeit mit einer Effizienz von nahezu Null verbringen.

Ich hoffe, dass es im Rahmen dieses Artikels möglich sein wird, ein ausreichendes Gleichgewicht zwischen der Komplexität des Materials und der Leichtigkeit der Wahrnehmung aufrechtzuerhalten, so dass der Text sowohl für Personen, die nicht mit diesem Bereich verwandt sind, als auch für diejenigen, die sich seit langem mit der Erforschung von Problemen befassen, mäßig einfach, verständlich und interessant ist diese Branche. Ich muss sofort sagen, dass es hier keine Formeln geben wird, die spezifische Terminologie wird ebenfalls minimiert.

Ich arbeite nicht für Google. Ich habe keine zwanzig Grad. Ich habe kein Praktikum bei der NASA gemacht. Ich habe nicht in Stanford studiert und bereue es bitter. Ich hoffe jedoch immer noch, dass ich verstehe, wovon ich spreche, wenn es um Prognosesysteme geht, und gleichzeitig bin ich ziemlich eng mit der Welt der Kryptowährung im Allgemeinen und dem Cardano-Projekt im Besonderen verbunden.

Natürlich konnte ich als Krypto-Enthusiast, der sich mit neuronalen Netzen beschäftigt, einfach nicht anders, als in das neblige Anwendungsfeld der KI in Bezug auf Kryptowährungen einzusteigen.


Das Wesentliche des Problems


Wie bereits erwähnt, gibt es so viele Materialien, die ausgearbeitet und scheinbar tiefgreifend zu sein scheinen, mit Beispielen zu diesem Thema, dass Ihre Augen weit aufgerissen sind. Und die Autoren sind sich so sicher, dass ihr Experiment im Gegensatz zu den vorherigen hundert erfolgreich ist, dass man sich fragt, warum der nächste Artikel nicht mit Fotos mit einem „Lamm“ auf einer persönlichen Insel und einer Liste von Autoren von „Kaggle-Kernen“ im Zusammenhang mit Preisprognosen endet zu Bitcoins, dupliziert keine Forbes-Listen.

Es wird erwartet, dass es Artikel über Habré gibt, die sich diesen Themen widmen. Und interessanterweise enden alle diese Artikel unabhängig von Ort und Sprache der Veröffentlichung mit ungefähr demselben Text: „Nun, das Ergebnis ist ziemlich gut, alles funktioniert fast , Sie müssen nur einige Hyperparameter verschärfen und alles wird gut.“

Und natürlich die Grafiken, in denen das neuronale Netzwerk den Preis ideal anzeigt, wie zum Beispiel:








Wir werden in Zukunft auf sie zurückkommen und sie sorgfältig prüfen.

Und um nicht unbegründet zu sein, hier einige Beispiele für solche Artikel: eins , zwei , drei .

Wie alles begann


Die Idee, neue Preise zu alten Zeiten vorherzusagen, ist alles andere als neu. Dies gilt nicht nur für Kryptowährungen. Es ist einfach so passiert, dass sie mir persönlich näher stehen, aber die Heimat der sogenannten „technischen Analyse“ ist schließlich der traditionelle Austausch. Das sind diejenigen, bei denen sie laut den Filmen alle teure Kostüme tragen, aber gleichzeitig wie Mädchen bei einem Konzert ihrer Lieblingsband schreien.

Beim Versuch, die Zukunft in der Vergangenheit zu sehen, erfanden die Menschen eine Vielzahl von kniffligen Oszillatoren, Indikatoren und Signalgeräten, die auf mathematischen Statistiken, Wahrscheinlichkeitstheorie und manchmal auch Frank Pareidolia basierten .

Am beliebtesten ist vielleicht die Suche nach Zahlen. Fünfzehn Minuten im Internet lesen und sogar jetzt an der Wall Street! Es ist so einfach - Sie müssen nur "Bart Simpsons Kopf", "Schmetterling", "Flagge (nicht zu verwechseln mit dem Keil! 11)", "Azurblau, das in einen Vakuumturm fällt" finden, viele, viele Linien bauen und ganz offen , interpretiere es zu deinem Vorteil!


Fast alle diese Lösungen haben einen kleinen, aber sehr dichten und schwerwiegenden Nachteil: Sie erfassen Trends perfekt ... nachträglich . Und wenn etwas als nicht fixierend, sondern prädiktiv deklariert wird, wird es so frei interpretiert, dass zehn Personen, die dasselbe Diagramm mit demselben Indikator betrachten, zehn unabhängige Prognosen abgeben. Und was charakteristisch ist, mindestens einer von ihnen wird höchstwahrscheinlich Recht haben!

Es wird aber auch nachträglich festgelegt. Und der Rest wird einfach sagen: "Ah, wir lesen die Signale unaufmerksam falsch."

Verstehe mich nicht falsch. Es ist durchaus möglich, dass ein echter Wall Street-Händler, der im Laufe der Jahre 20 Schreie und 200 Selbstmordversuche unternommen hat, eine Reihe von Indikatoren und Oszillatoren aufeinander stapelt und dort, wie der Betreiber aus dem Film „The Matrix“, nützlich liest Daten mit einer ausreichend hohen Matte gewürzt, die auf eine erfolgreiche Transaktion warten. Ich gebe sogar zu, dass speziell Sie, der Leser, auch wissen, wie. Ohne einen Tropfen Sarkasmus gebe ich zu. Am Ende werden sie aus irgendeinem Grund erfunden, verbessert, diese Indikatoren ...

Moderne Probleme erfordern moderne Lösungen!


Bis zum Jahr 2015 hatten alle bereits neuronale Netze gehört. Rosenblatt stellte sich nicht einmal vor, wie viel sie hören würden. Dank verantwortungsbewusster, professioneller und medienaffiner Menschen hat die Menschheit gelernt, dass neuronale Netze die elektronischste Version des menschlichen Gehirns sind, die jede Aufgabe schneller und besser lösen kann, mit unbegrenztem Potenzial. Im Allgemeinen springen wir hier durch eine Singularität direkt ins Licht dunkle Zukunft. Hier ist es wie viel Glück.

Aber es gab ein "aber". Vorerst lebten neuronale Netze nur in reservierten mathematischen Paketen in einer sehr sehr niedrigen Form und unterstützten Mathematiker und Wissenschaftler mit Graphen in MatLabs.

Aber die Popularisierung hat ihren Job gemacht und die Aufmerksamkeit von Entwicklern mit unterschiedlichem Grad an Unabhängigkeit auf die Branche gelenkt. Dieselben Entwickler, die im Gegensatz zu gewöhnlichen Mathematikern mit edler Faulheit ausgestattet waren, begannen nach Wegen zu suchen, um mehrere Abstraktionsebenen in diese Angelegenheit zu bringen, um sich und allen das Leben zu erleichtern und der Welt ein sehr praktisches und qualitativ hochwertiges Tool auf hoher Ebene wie Keras oder FANN zu zeigen. In diesem Eifer gelang es ihnen so sehr, dass sie die Arbeit mit neuronalen Netzen auf das Niveau von „nur einmal und funktioniert“ brachten und allen Ankömmlingen den Weg in die Welt der Wunder und der Magie ebneten.

Es sind Wunder und Magie, nicht Mathematik und Fakten.


Die Geburt einer Legende


Neuronale Netze sind für alle verfügbar, nah und einfach zu nutzen. Im Ernst, die FANN-Implementierung ist sogar für PHP. Darüber hinaus ist es in der Liste der Grunderweiterungen enthalten .

Was ist mit Keras? In 10 Zeilen können Sie ein Netzwerk mit wiederkehrenden Faltungen erfassen, ohne zu verstehen, wie Faltungen funktionieren oder wie sich LSTM von GRU unterscheidet! Künstliche Intelligenz für alle und jeden! Und lass niemanden beleidigt gehen!

Ich denke, zum Teil spielte die Terminologie den grausamsten Witz. Wie heißen neuronale Netzwerkausgänge? Ja. Vorhersagen. Vorhersagen. Ein neuronales Netzwerk sagt Daten über andere voraus. Es klingt genau so, wie Sie es brauchen .

Handbücher für Bibliotheken auf hoher Ebene schützen den Benutzer vor komplexen Begriffen, Matrizen, Vektoren, Transformationen, Differentialrechnung, mathematischen Bedeutungen dieser Gradienten, Regressionen und Regularisierungsverlusten.

Und vor allem schützen sie das romantische Bild des „zu allem fähigen elektronischen Modells des menschlichen Gehirns“ vor der harten Realität, in der die neuronalen Netze nur ein Approximator sind, was grob gesagt nichts weiter als ein evolutionärer Schritt gegenüber dem gewöhnlichen linearen Klassifikator ist.

Es spielt jedoch keine Rolle, wann Sie Ihren ersten Löser für CIFAR-10 aus den Auflistungen in der Dokumentation zusammenstellen, ohne irgendwelche Anstrengungen zu unternehmen, ohne wirklich zu verstehen, was passiert. Es gibt nur einen Gedanken:


Was kann ich sagen, was kann ich sagen, die Leute sind so arrangiert ...


Hier ist es, ein technologisches Wunder! Sie geben ihm nur einige Daten am Eingang, andere am Ausgang, aber er selbst findet eine Verbindung und lernt, die Ausgaben anhand der Eingaben vorherzusagen . Wie viele Probleme können gelöst werden! Wie viele Aufgaben können geebnet werden!

So viel zu sagen ! Interessanterweise wissen andere Menschen im Allgemeinen Bescheid? Mit diesem Toolkit sind meine Möglichkeiten endlos! UNBEGRENZT!


Aber was ist, wenn Sie das neuronale Netzwerk mit Kerzen aus der Krypto-Börse / Börse / Forex versorgen und ihm eine Kerze aus dem nächsten Zeitraum zum Verlassen geben? Sie wird dann lernen, neue Werte aus früheren vorherzusagen! Immerhin ist es das, wofür es gemacht wurde! Ein neuronales Netzwerk kann alles vorhersagen, es würde Daten geben, und Daten zur Geschichte von Zitaten sind ein Dutzend! Oh, Inspiration, nur einen Moment, aber so schön!

Warum nicht?


Denn in einer realen Welt, die sich von der von den Medien geschaffenen Welt unterscheidet, funktioniert dies nicht so. Neuronale Netze sind keine Maschine für Vorhersagen. Neuronale Netze sind Approximatoren. Sehr gute Approximatoren. Es wird angenommen, dass neuronale Netze fast alles annähern können. Mit nur einer Bedingung - wenn es "etwas" ist, eignet es sich zur Annäherung .

Und dann gerät ein unerfahrener Forscher in den Haken der kognitiven Verzerrung. Der erste und wichtigste Fehler ist, dass historische Angebotsdaten mehr als nur Statistiken zu sein scheinen. Sie können so viele Dreiecke und Pfeile darauf zeichnen, dass nur eine blinde Person beim Betrachten nicht offensichtlich ist, dass dies alles eine bestimmte Logik hat, die einfach nicht rechtzeitig gezählt werden kann. Aber was die Maschine vielleicht weiß.

Wenn man Statistiken betrachtet , sieht eine Person eine Funktion . Die Falle knallt.
Was ist der zweite Fehler / die kognitive Verzerrung? Aber hier ist die Sache.

Und es funktioniert mit dem Wetter!


Dies ist ein sehr häufiges Argument, das ich in Krypto-Communities in Dialogen über die Möglichkeiten höre, mithilfe statistischer Analysemethoden etwas aus historischen Daten vorherzusagen. Es funktioniert mit dem Wetter. Das Wesentliche der Verzerrung ist, dass "wenn A für B funktioniert, aber mir scheint, dass B dasselbe ist wie C, dann sollte A auch für C funktionieren." Eine Art Pseudotransitivität, die auf einem unzureichenden Verständnis der Prozesse beruht, die den Unterschieden zwischen B und C zugrunde liegen.

Mit dem gleichen Erfolg können wir beispielsweise annehmen, dass die Pedale im Cockpit des Flugzeugs während eines Automatikgetriebes Bremse und Gas sind und überhaupt kein horizontales Lenkrad. Die intuitive Wahrnehmung einiger Dinge ist leider nicht immer korrekt, da sie nicht immer auf einem ziemlich vollständigen Datensatz über die Situation / das System / das Objekt beruht. Hallo Bayes! Wie geht es dir?

Lassen Sie uns etwas tiefer in die Theorie einsteigen.

Chaos und das Gesetz


So kam es, dass alle Prozesse und Ereignisse in unserer Realität in zwei Gruppen eingeteilt werden können: stochastisch und deterministisch. Da ich mich bemühe, trostlose Begriffe zu vermeiden, ersetzen wir sie durch einfachere Begriffe: unvorhersehbar und vorhersehbar.


Wie Obi-Wan zu Recht sagt, ist es nicht so einfach. Tatsache ist, dass in der realen Welt, nicht in der theoretischen, alles etwas komplizierter ist und vollständig vorhersehbare und völlig unvorhersehbare Prozesse einfach nicht existieren. Maximal gibt es quasi vorhersehbare und quasi unvorhersehbare. Nun, das heißt, hier sind fast unvorhersehbar und fast vorhersehbar. Fast fast, aber nein.

Zum Beispiel fällt Schnee quasi vorhersehbar von oben nach unten. In fast 100% der Fälle beobachtet. Aber nicht in meinem Küchenfenster! Dort schneit es aufgrund der Eigenschaften des Luftstroms und der Form des Hauses von unten nach oben. Aber nicht immer! Auch in fast 100% der Fälle, aber nicht immer. Manchmal fällt es auch in mein Küchenfenster. Es scheint, dass sich eine so einfache Sache, aber für denselben Beobachter in zwei verschiedenen Fällen, völlig unterschiedlich verhält und beide Verhaltensweisen mit einer Wahrscheinlichkeit von fast 100% normal und quasi vorhersehbar sind, obwohl sie sich völlig widersprechen . Nicht schlecht? Das quasi vorhersehbare Ereignis erwies sich als ... quasi unvorhersehbar? Außerdem.

In diesem Moment beginnt unser Freund Bayes zu lachen. Was ist mit unvorhersehbaren Ereignissen? Ich werde das Präfix "quasi" nicht verwenden, okay? Jeder versteht schon, dass ich es ernst meine. Also. Nehmen Sie etwas völlig Unvorhersehbares. Brownsche Bewegung? Ein gutes Beispiel für ein völlig unvorhersehbares System. Es ist so? Fragen wir die Quantenphysiker:


Tatsache ist, dass theoretisch sogar ein so komplexes System wie die Brownsche Bewegung im realen Maßstab theoretisch den Zustand dieses Systems jederzeit in der Zukunft oder in der Vergangenheit modellieren und vorhersagen kann. In der Theorie. Über wie viel Berechnungen, Fähigkeiten, Zeit und Opfer für die Dunklen Götter dafür notwendig sind, schweigen wir taktvoll.

Und auch ein vorhersehbares System im allgemeinen Fall, das unvorhersehbar wird, wenn Sie die Skala auf das Niveau bestimmter Fälle senken, ist tatsächlich ziemlich vorhersehbar, wenn Sie den Beobachtungsbereich eines bestimmten Falls um externe Faktoren erweitern und eine vollständigere Beschreibung des Systems in diesem speziellen Fall erhalten.

Die Wahrheit ist, dass Sie, wenn Sie die Besonderheiten der Luftströmungen an einem bestimmten Ort kennen, die Flugrichtung des Schnees leicht vorhersagen können. Wenn man die Besonderheiten des „Reliefs“ eines bestimmten Ortes kennt, kann man die Richtung des Luftstroms vorhersagen. Wenn man die Besonderheiten des Geländes kennt, kann man die Besonderheiten des Geländes vorhersagen. Und so weiter und so fort. Zur gleichen Zeit begannen wir wieder zu zoomen, aber jetzt für ein bestimmtes Ereignis. Trennen Sie es von der „allgemeinen“ Definition des Verhaltens dieses Ereignisses. Jemand, hör auf Bayes, er hat einen Angriff!

Was bekommen wir also? Jedes System ist gleichzeitig vorhersehbar und bis zu dem einen oder anderen Grad unvorhersehbar. Der Unterschied besteht nur in der Skala der Beobachtungen und der Vollständigkeit der Anfangsdaten, die es beschreiben.

Was hat die Wettervorhersage und der Börsenhandel damit zu tun?


Wie wir bereits herausgefunden haben, ist die Grenze zwischen einem vorhersehbaren und einem unvorhersehbaren System extrem dünn. Aber stark genug, um eine Grenze zwischen Wettervorhersage und Handel zu ziehen.

Wie wir bereits wissen, besteht selbst das unvorhersehbarste System tatsächlich aus vollständig vorhersehbaren Fragmenten. Um es zu modellieren, reicht es aus, auf die Skala dieser Fragmente zu gehen, den Beobachtungsbereich zu erweitern, die Muster zu verstehen und sie beispielsweise mithilfe eines neuronalen Netzwerks zu approximieren. Oder leiten Sie eine ganz bestimmte Formel ab, mit der Sie die gewünschten Parameter berechnen können.

Und hier liegt der Hauptunterschied zwischen der Wettervorhersage und der Preisvorhersage - der Skala der größten vorhersagbaren simulierten Komponente. Für die Wettervorhersage ist der Maßstab dieser Komponenten so, dass sie gut sind ... sie können mit bloßem Auge von der Erdumlaufbahn aus gesehen werden. Und was nicht sichtbar ist, zum Beispiel Temperatur und Luftfeuchtigkeit, kann dank Wetterstationen auch auf der ganzen Welt in Echtzeit gemessen werden. Für den Handel diese Skala ... dazu später mehr.

Der Zyklon sagt nicht "Ich bin müde, ich gehe" und verschwindet zu einem unvorhersehbaren Zeitpunkt aus heiterem Himmel. Die Wärmemenge, die von einer bestimmten Hemisphäre des Planeten von der Sonne empfangen wird, variiert mit demselben Muster. Die Bewegung von Luftmassen auf planetarischer Ebene erfordert keine atomare Simulation und wird auf Makroebene ziemlich simuliert. Ein System namens "Wetter", das ein zufälliges Ereignis auf der Skala eines bestimmten Punktes auf der Erde ist, ist auf globaleren Skalen ziemlich vorhersehbar. Trotzdem lässt die Genauigkeit dieser Vorhersagen in Entfernungen von mehr als ein paar Tagen zu wünschen übrig. Das System ist zwar vorhersehbar, aber sehr komplex, so dass es zu jedem Zeitpunkt mit angemessener Genauigkeit modelliert werden kann .

Und hier kommen wir zu einer weiteren wichtigen Eigenschaft von Vorhersagemodellen.

Autarkie oder Autonomie der Vorhersagen


Diese Eigenschaft ist im Allgemeinen recht einfach: Ein autarkes Prognosesystem oder ein ideales Prognosesystem kann ohne externe Daten auskommen , ohne den Ausgangszustand zu berücksichtigen.

Sie ist vollkommen genau. Um die Eigenschaften des Systems im Zustand N vorherzusagen, reicht es aus, die berechneten Daten im Zustand N-1 zu erhalten. Und wenn Sie den Zustand von N kennen, können Sie N + 1, +2, + m erhalten.

Solche Systeme umfassen beispielsweise jede mathematische Progression. Wenn man den Zustand am Referenzpunkt und die Anzahl dieses Punktes in einer Reihe von Ereignissen kennt, kann man den Zustand an jedem anderen Punkt leicht berechnen. Cool!


Und dies ist auch die Antwort auf die Frage, warum die Genauigkeit der Wettervorhersage über eine lange Zeitspanne dramatisch abnimmt. Mit Blick auf die Zukunft erstellen wir eine Prognose, die nicht auf dem tatsächlichen Zustand des Systems basiert, sondern auf dem vorhergesagten. Außerdem leider nicht mit 100% Genauigkeit. Als Ergebnis erhalten wir den Effekt, dass sich Prognosefehler ansammeln . Dies trotz der Tatsache, dass wir fast alle signifikanten "Variablen" kennen und die Beschreibung des Systems als fast "vollständig" bezeichnet werden kann.

Was ist mit Zitaten?


Und mit Zitaten sind die Dinge viel schlimmer. Tatsache ist, dass bei der Wettervorhersage fast alle empfangenen und vorhergesagten Daten sowohl Ursache als auch Wirkung der Ereignisse sind. Die Konsequenz der Ereignisse des vorherigen Schritts, die Ursache der Ereignisse des nächsten Schritts. Darüber hinaus verursachen und tragen diese signifikanten Daten und Ereignisse, die nicht sowohl Ursache als auch Wirkung sind, höchstwahrscheinlich einfach eine starke Nutzlast. Zum Beispiel die Wärmemenge, die zu einem bestimmten Zeitpunkt von der Sonne empfangen wird. Und es ist unveränderlich. Dies erhöht den Selbstversorgungsindikator solcher Prognosen. Die Konsequenz fließt in den Grund für die Ereignisse im nächsten Schritt ein. Dies ist ein vollständig nicht-Markov-Prozess , der durch Differentialgleichungen beschrieben werden kann.

Während die Statistik der Anführungszeichen hauptsächlich entweder nur Konsequenzen oder 50 \ 50 ist . Das Wachstum von Quotes kann eine weitere Erhöhung der Quotes auslösen und zu einer Ursache werden. Und es darf nicht provozieren und verursachen. Und es kann zu Gewinnmitnahmen und damit zu Preissenkungen führen. Historische Daten zu Börsen sehen solide aus. Volumen, Preise, "Brille", so viele Zahlen! Die überwiegende Mehrheit davon ist für nichts gut, da sie nur das Ergebnis, das Echo von Ereignissen und Ursachen ist und weit über die Ebene dieser Statistiken hinausgeht . In einem ganz anderen Maßstab. In einem ganz anderen Rahmen.

Bei der Modellierung zukünftiger Angebote stützen wir uns nur auf die Folgen von Ereignissen, die viel komplexer sind als nur die prozentuale Abweichung des Kaufvolumens.Der Preis formt sich nicht . Es kann nicht von selbst unterschieden werden. Wenn der Markt als metaphorischer See ausgedrückt wird, ist der Aktienchart nur eine Welle auf dem Wasser. Vielleicht wehte dieser Wind, vielleicht warfen sie einen Stein ins Wasser, vielleicht spritzte der Fisch, vielleicht springt Godzilla 200 Kilometer auf einem Trampolin. Wir sehen nur Wellen. Aber in dieser Welle versuchen wir, die Stärke des Windes in 4 Tagen vorherzusagen, die Anzahl der Steine, die in einem Monat ins Wasser geworfen werden, die Stimmung des Fisches übermorgen oder vielleicht die Richtung, in die Godzilla gehen wird, wenn er es leid ist zu springen. Er wird näher kommen und das Trampolin wieder einsetzen - die Wellen werden stärker! Fangen Sie den Trend, Hop Hop Hop!



Dies ist ein sehr wichtiger Punkt:
, , , .
Mit anderen Worten, Sie können das System nicht gut genug modellieren, ohne eine ausreichend vollständige Beschreibung zu haben.

Leider hängt der Umfang der maximal möglichen simulierten Komponente des Systems im Falle des Marktes vom Menschen ab. Nicht einmal für einen Menschen, sondern für seinen psychophysischen Zustand, von dem die Reaktion auf das Marktverhalten abhängt und der durch diese Reaktion selbst den Markt beeinflusst. Der Grund fließt in die Konsequenz! Nur Tausende, wenn nicht Millionen einzigartiger, individueller Menschen müssen modelliert werden. Mit persönlichen Problemen, Gefühlen, hormonellem Hintergrund, Interaktionen, alltäglichen Aktivitäten.

Und es geht nicht nur um Händler auf dem globalen Markt. Es geht auch um die Menschen hinter bestimmten Projekten. Es geht um die Probleme und Erfolge von Projekten in der Zukunft. Es geht um wichtige Ereignisse in derselben Zukunft. Ereignisse, manchmal extrem unvorhersehbar. Es stellt sich heraus, dass wir die Zukunft kennen müssen, um die Zukunft vorhersagen zu können.


Insgesamt brauchen wir eine Sphäre beobachteter Zustände, die für uns völlig unzugänglich ist. Der Umfang der Simulation, der für uns völlig unerreichbar ist.

Nun, das ist theoretisch natürlich erreichbar. Die Brownsche Bewegung ist theoretisch auch ein sehr simuliertes und vorhersehbares System. Denken Sie dann an den Preis für die praktische Implementierung einer solchen Simulation. Dieser Preis ist unerschwinglich höher als der Prozess der Versorgung eines neuronalen Netzwerks mit Austauschkerzen. Zumindest zum Zeitpunkt dieses Schreibens.

Aber was ist mit der Grafik?


Ja wirklich. Ganz am Anfang dieses Artikels haben wir Diagramme mit extrem hoher Prognosegenauigkeit vorgestellt, die an Orte mit 100% grenzen.

Schauen wir sie uns noch einmal an:








Was siehst du? Schau genauer hin. Großer Zufall, nicht wahr? Perfekt, einfach perfekt. Und in der ersten und zweiten Grafik ist das neuronale Netzwerk den Zitaten natürlich einen Schritt voraus!

Denken Sie daran, ich habe Bibliotheken auf hoher Ebene für die Arbeit mit neuronalen Netzen erwähnt, und dann wurde dies im Text des Artikels nicht weiterentwickelt. Jetzt hol es dir. Die weit verbreitete Verfügbarkeit von allem reduziert sicherlich die Messlatte für die Schulung des durchschnittlichen Benutzers. Das gleiche passiert mit neuronalen Netzen. "Kaggle-Kernel" ist ein Rekord. Jeder Abschnitt ohne schmalen Abschnitt ist einfach in Tonnen von Lösungen vergraben, deren Autoren in der überwiegenden Mehrheit überhaupt keine Ahnung haben, was sie tun. Und von unten wird jede Entscheidung durch Säulen lobender Kommentare von Menschen unterstützt, die das Problem noch weniger verstehen. "Großartige Arbeit, was Sie brauchen!", "Ich habe so lange nach einem Kernel gesucht, der für meine Aufgaben geeignet ist, hier ist er! Und wie benutzt man es? " usw.

Darunter etwas wirklich Interessantes und Schönes zu finden, ist sehr, sehr schwierig.
<hektischer Snobismus>
Infolgedessen haben wir ein solches Phänomen wie Menschen, die leicht mit einem ziemlich komplizierten mathematischen Apparat arbeiten können, aber keine Graphen lesen können .
</ tollwütiger Snobismus>

Schließlich bewegt sich die Zeit auf der X-Skala nach rechts, und im Idealfall sollte vor dem Ereignis eine Vorhersage erhalten werden .

Einfach Hyperparameter sind noch nicht verdreht


Wir sind alle glücklich, wenn unser neuronales Netzwerk Anzeichen von Konvergenz zeigt. Aber es gibt Nuancen. Bei der Programmierung als solcher gibt es die Regel "gestartet heißt nicht verdient". Als wir gerade erst anfangen, Programmieren zu lernen, sind wir sehr zufrieden mit der Tatsache, dass der Compiler / Interpreter verstehen konnte, was wir hineingeschlichen sind, und uns keine Fehler geworfen hat. Auf dieser Bildungsebene glauben wir, dass Fehler in einem Programm nur syntaktisch sind.

Beim Entwurf neuronaler Netze ist alles gleich. Nur statt Kompilierung ist Konvergenz. Es hat geklappt - es bedeutet nicht, genau zu lernen, was wir brauchen. Was hat es also gelernt?

Ein unerfahrener Forscher, der sich so schöne Grafiken ansieht, wird wahrscheinlich herauskommen. Aber mehr oder weniger erfahren, wachsam, weil es nicht so viele Möglichkeiten gibt:

  1. Das Netzwerk wird explizit umgeschult (im Sinne von "redundant" statt "Wiederverwendung").
  2. Das Netzwerk nutzt einen Fehler in den Lehrmethoden aus
  3. Das Netzwerk hat sich dem Exchange Grail angenähert und kann jederzeit die Marktlage vorhersagen, indem es ein endloses Diagramm aus nur einer Kerze „ausbreitet“

Was denkst du, welche Option ist näher an der Realität? Leider nicht der dritte . Ja, das Netzwerk hat wirklich gelernt. Sie gibt wirklich erstaunlich genaue Ergebnisse, aber warum?

Obwohl künstliche neuronale Netze kein „elektronisches Modell des menschlichen Gehirns“ sind, weisen sie dennoch einige Eigenschaften des „Geistes“ auf. Grundsätzlich ist dies "Faulheit" und "Trick". Und gleichzeitig. Und dies sind nicht die Konsequenzen des Auftauchens in ein paar Hundert "Neuronen" des Selbstbewusstseins. Dies sind die Konsequenzen der Tatsache, dass der Begriff „Optimierung“ tatsächlich hinter dem populistischen Begriff „Bildung“ verborgen ist.

Ein neuronales Netzwerk ist kein Student, der studiert und versucht zu verstehen, was wir ihm erklären, zumindest zum Zeitpunkt dieses Schreibens. Ein neuronales Netzwerk ist ein Satz von Gewichten, deren Werte so angepasst oder optimiert werden müssen, dass der Fehler des Ergebnisses des neuronalen Netzwerks relativ zum Referenzergebnis minimiert wird.

Wir geben dem neuronalen Netzwerk eine Aufgabe und bitten es dann, "die Prüfung zu bestehen". Nach den Ergebnissen der „Prüfung“ entscheiden wir, wie erfolgreich sie ist, und glauben zu Recht, dass unser Netzwerk bei der Vorbereitung auf die „Prüfung“ ausreichende Kenntnisse, Fähigkeiten und Erfahrungen erworben hat.

Sehen Sie den Haken? Nein? Ja, hier ist es an der Oberfläche! Während Ihr Ziel darin besteht, Ihrem Netzwerk nützliche Fähigkeiten beizubringen, besteht Ihr Ziel Ihrer Meinung nach darin, die Prüfung zu bestehen .


Um jeden Preis. Auf jeden Fall. Vielleicht hat sie dennoch mit einigen Studenten mehr gemeinsam als in den beiden Absätzen zuvor angegeben ...

Wie bestehen Sie die berüchtigte Prüfung?

Sich einprägen


Die erste Option auf der Liste der möglichen Gründe für diese unglaubliche Genauigkeit. Fast jeder unerfahrene Forscher künstlicher neuronaler Netze weiß mit Sicherheit, dass je mehr Neuronen darin enthalten sind, desto besser. Und noch besser, wenn es viele, viele Schichten gibt.

Dabei wird jedoch nicht berücksichtigt, dass die Anzahl der Neuronen und Schichten nicht nur das Netzwerkpotential im Bereich des "abstrakten Denkens" erhöht, sondern auch die Menge seines Gedächtnisses. Dies gilt insbesondere für wiederkehrende Netzwerke, da ihre Speicherkapazität wirklich ungeheuerlich ist.

Als Ergebnis stellt sich während des Optimierungsprozesses heraus, dass dies das Optimalste istDie Option, die Prüfung zu bestehen, ist ... regelmäßiges Crammen oder "Überanpassen", "Überanpassen". Das Netzwerk lernt einfach alle „richtigen Antworten“ auswendig. Absolut nicht verstehen, nach welchen Prinzipien sie gebildet werden. Wenn das Netzwerk an einem Datenbeispiel getestet wird, das es noch nie zuvor gesehen hat, trägt das Netzwerk daher Unsinn.

Aus diesem Grund benötigen Sie für das Training von Deep / Wide-Netzwerken viel mehr Daten, Regularisierung und Kontrolle über die minimale Fehlerschwelle, die klein, aber nicht zu groß sein sollte. Und noch besser, finden Sie das richtige Gleichgewicht zwischen der Größe des Netzwerks und der Qualität der Lösung.

Gut. Wir werden überlegen. Wir werden die zusätzlichen Schichten wegwerfen. Die Architektur ist vereinfacht. Wir werden alle möglichen Tricks implementieren. Wird es jetzt funktionieren? Ist keine Tatsache. Immerhin Nummer zwei auf der Liste der einfachen Prüfungsoptionen:

Überlisten Sie den Lehrer


Da die Klassifizierung eines neuronalen Netzwerks nicht für den Prozess, sondern für das Ergebnis gilt, kann der Prozess, mit dem dieses Ergebnis erzielt wird, geringfügig von dem abweichen, was der Entwickler beabsichtigt hat. Dies ist einer der abscheulichsten Momente der Arbeit mit diesen schönen Tieren - wenn das Netzwerk gelernt hat, aber nicht das.

Wenn Sie Diagramme mit Kursvorhersagen sehen, die den tatsächlichen Kurs perfekt wiederholen, denken Sie darüber nach, was Sie dem neuronalen Netzwerk beigebracht haben? Super genau, um Preise vorherzusagen? Oder vielleicht einfach wie ein Papagei wiederholen?

Stellen Sie sicher, dass das Netzwerk, das auf dem Trainingssatz eine fast 100% ige Genauigkeit und auf dem Testsatz dieselbe Genauigkeit aufweist, einfach alles wiederholt, was es sieht. Netzwerke, in denen der Vorhersagediagramm einen Schritt nach rechts verschoben wird (Beispiele für die Diagramme 1 und 2), wiederholen einfach den Preiswert aus dem vorherigen Schritt, der in einem neuen an sie übergeben wird. Die Grafiken sehen natürlich sehr ermutigend aus und passen fast perfekt zusammen, aber sie haben keine Vorhersagekraft. Sie können den gestrigen Preis heute selbst bekannt geben, dafür müssen Sie nicht in Hogwarts studieren oder Palantir polieren, oder?

Dies ist jedoch der Fall, wenn Sie ihnen die Werte aus dem vorherigen Schritt geben und sie mit dem Wert des aktuellen Schritts vergleichen. Manchmal geben die Leute einfach einen Wert aus dem aktuellen Schritt an und vergleichen ihn mit dem nächsten Schritt. In diesem Fall erhalten wir wunderschöne Grafiken, die fast perfekt zu den Originalen passen (Beispiele für die Grafiken 3 und 4).

Manchmal können Sie Diagramme sehen, die nicht perfekt übereinstimmen, weicher, als ob sie geglättet oder interpoliert wären . Dies ist normalerweise ein deutliches Zeichen für ein rekursives Netzwerk, das versucht, ein neues Ergebnis mit einem vorherigen zu verknüpfen (Grafikbeispiel 3).

Alle diese Ergebnisse haben nur eines gemeinsam: Das neuronale Netzwerk hat gelernt, die 5-plus-Prüfung zu bestehen. Sie hat jedoch nicht gelernt, die ihr zugewiesene Aufgabe so zu lösen, wie es erforderlich war, und hat für den Forscher keinen praktischen Nutzen. Genau wie ein Student, aber mit einem Spickzettel, oder?

Warum wiederholt das Netzwerk die vorherigen Werte und versucht nicht, neue zu generieren? Ja, einfach während des Trainings kommt sie zu dem vernünftigen Schluss, dass der nächstgelegene Punkt zum nächsten Punkt in der Grafik normalerweise der vorherige ist. Ja, die Größe des Fehlers schwebt in diesem Fall, aber bei einer großen Stichprobe ist sie stabil kleiner als die Größe des Fehlers, wenn versucht wird, den nächsten Zustand in einem quasi zufälligen Prozess vorherzusagen .

Neuronale Netze können perfekt verallgemeinern. Eine solche Verallgemeinerung ist eine hervorragende Lösung für das Problem.

Leider wird sich die Zukunft für sie nicht öffnen, egal wie Sie Hyperparameter verdrehen. Das Diagramm bewegt sich nicht einen Schritt zurück in die Vergangenheit. Ja, der Gral ist so nah, aber so weit.


Halt. Nein nein Nein. Aber was ist mit algorithmischem Handel? Sie existiert!


Genau. Natürlich existiert es. Der entscheidende Punkt ist jedoch, dass dieser algorithmische Handel nicht mit der algorithmischen Wahrsagerei identisch ist . Der algorithmische Handel basiert auf der Tatsache, dass das Handelssystem den Markt zum aktuellen Zeitpunkt analysiert und die Entscheidung trifft, eine Transaktion auf der Grundlage einer großen Anzahl objektiver Parameter und indirekter Zeichen zu eröffnen und zu schließen.

Ja, dies ist technisch gesehen auch ein Versuch, das Verhalten des Marktes vorherzusagen, aber im Gegensatz zu den Vorhersagen für Tage und Monate im Voraus versucht das Handelssystem, in den zulässigsten kleinen Zeitintervallen zu arbeiten.

Erinnerst du dich an die Wettervorhersage? Denken Sie daran, dass seine Genauigkeit über große Entfernungen dramatisch abnimmt? Es funktioniert in beide Richtungen. Je kürzer der Abstand, desto höher die Genauigkeit. Wenn Sie aus dem Fenster schauen, können Sie auch ohne Meteorologe vorhersagen, wie hoch die Lufttemperatur in einer Sekunde sein wird, oder?

Aber wie funktioniert es? Widerspricht das nicht allem, was gesagt wurde? Aber was ist mit Wellen auf dem Wasser, wie wäre es mit dem Mangel an Daten? Was ist schließlich mit Godzilla?

Aber nein, es gibt keine Widersprüche. Solange der Handelsbot in sehr kleinen, wirklich kleinen Intervallen von einer Minute bis zu Bruchteilen einer Sekunde arbeitet, muss er je nach Typ die Zukunft nicht kennen und kein vollständiges Bild des Marktes haben. Es reicht ihm zu verstehen, wie das System um ihn herum funktioniert. Unter welchen Umständen ist es besser, einen Deal darin zu eröffnen, in dem geschlossen werden soll. Ein Handelsbot arbeitet in einem so kleinen Maßstab, dass sein Sichtfeld genügend Faktoren abdecken kann, um über eine akzeptable kurze Distanz eine erfolgreiche Entscheidung zu treffen. Und um dies zu tun, muss er den globalen Zustand des Systems absolut nicht kennen .

Fazit


Der Artikel erwies sich als groß. Mehr als ich erwartet hatte. Ich hoffe, es wird jemandem nützlich sein und dazu beitragen, Zeit für jemanden zu sparen, der sich entschlossen hat, sein Glück auf der Suche nach dem Heiligen Gral des Handels zu versuchen.

Lassen Sie uns die wichtigsten Punkte hervorheben:

  1. Godzilla hat ein Trampolin
  2. Sie müssen verstehen, mit welchen Tools Sie das Problem lösen
  3. Es ist notwendig, die Grenzen der Anwendbarkeit zu verstehen und die Lösbarkeit des Problems als solches angemessen zu bewerten
  4. Es ist wichtig, die Ergebnisse des Toolkits richtig interpretieren zu können
  5. Neuronale Netze sind Funktionsapproximatoren, keine Prädiktoren der Zukunft
  6. f(x)=xundf(xn)=xn1 - das sind auch Funktionen
  7. Um den Status eines Systems zu simulieren, benötigen Sie eine vollständige oder nahezu vollständige Beschreibung dieses Systems
  8. Statistik - nur eine teilweise, selektive Beschreibung der Folgen des Systems
  9. Ein gutes Prognosesystem sollte mäßig autark sein
  10. Neuronale Netze können nicht für ein Wort gehalten werden, sie sind heimtückisch, gerissen und faul
  11. Möchten Sie, dass AI Ihnen beim Handeln hilft? Bringe ihm das Handeln bei

Vielen Dank an alle, die bis zum Ende gelesen haben!

PS Nein, dies ist kein Artikel über die "Fundamentalanalyse von VS Technical". In diesem Artikel geht es um "Es gibt keine Wunder".

All Articles