"Ja, sie existieren!" Was machen Data Science-Spezialisten in Kasachstan und wie viel verdienen sie?

Dmitry Kazakov , Leiter des Data Analytics-Teams bei der Kolesa Group, gibt Einblicke in die erste kasachische Umfrage unter Datenexperten.


Auf dem Foto: Dmitry Kazakov

Erinnern Sie sich an den beliebten Satz, dass Big Data dem Sex im Teenageralter am ähnlichsten ist - alle reden darüber, aber niemand weiß, ob es wirklich so ist. Das Gleiche gilt für den Markt der Datenspezialisten (in Kasachstan) - es gibt einen Hype, aber wer dahinter steckt ( und zumindest jemand da ist ), war nicht ganz klar - weder Eychars noch Manager noch die Daten der Wissenschaftler selbst.

Wir haben eine Studie durchgeführt, in der wir mehr als 300 Spezialisten zu ihren Gehältern, Funktionen, Fähigkeiten, Werkzeugen und vielem mehr befragt haben.

Spoiler:Ja, sie existieren definitiv, aber alles ist nicht so einfach.

Schöner Einblick. Erstens gibt es mehr Datenspezialisten als wir erwartet hatten. Es ist uns gelungen, 300 Personen zu interviewen, darunter nicht nur Produkt-, Marketing- und BI-Analysten, sondern auch ML-, DWH-Ingenieure, was besonders erfreulich war. In der größten Gruppe befanden sich alle, die sich Datenwissenschaftler nennen - das sind 36% der Befragten. Es ist schwer zu sagen, ob dies die Marktnachfrage abdeckt oder nicht, da der Markt selbst nur gebildet wird.



Die Verteilung der Job-Levels ist peinlich - es gibt fast so viele Teamleiter und -leiter wie Dzhuns. Dafür kann es mehrere Gründe geben. Zum Beispiel eine große Anzahl kleiner Teams von 2-3 Personen, in denen der Leiter ein Spezialist auf mittlerer oder höherer Ebene sein kann.



Ein weiterer Grund könnte das Chaos sein, das auf dem Markt in Bezug auf Standards bei der Verteilung von Rollen und Funktionen herrscht. Timlids werden manchmal von Personen ernannt, die lediglich ein oder zwei Jahre länger als andere arbeiten, ohne auf das Niveau der Fähigkeiten und Kenntnisse Bezug zu nehmen. Wir sehen dies auch in der Verteilung der Funktionen nach Positionen - 38% der Manager und Teamleiter befassen sich mit der Vorverarbeitung und weitere 33% mit der grundlegenden statistischen Analyse.





Hier haben wir die Befragten gebeten, den Grad der Analyse in ihren Unternehmen subjektiv zu bewerten. Wenn Sie genau hinschauen, können Sie sehen, dass 10% der Befragten, die in den Analyseabteilungen von 2-3 Personen arbeiten, der Meinung sind, dass sie ein „fortgeschrittenes Niveau“ haben.

Und was ist ein „fortgeschrittenes Level“? Das BI-System funktioniert einwandfrei. Es gibt DWH und Big Data. A / B-Tests werden regelmäßig durchgeführt. Es gibt funktionierende ML- und DS-Systeme in der Produktion. Entscheidungen werden nur anhand der Daten getroffen. Die Abteilung für Arbeit mit Daten und Data Science ist einer der Schlüssel im Unternehmen.

All dies ist fast unmöglich, um eine Abteilung von 2-3 Personen zu erreichen. Ich glaube, dass ein solches Umfrageergebnis eine kleine Wachstumskrankheit ist - die Jungs haben niemanden, mit dem sie sich vergleichen können, um ihr Niveau objektiver zu bestimmen.





Es wird erwartet, dass Datenspezialisten die meiste Zeit nicht für hochkomplexe Mathematik oder Ingenieurwissenschaften aufwenden, sondern für die Vorverarbeitung, das Hochladen und das Bereinigen der Daten. In jeder Spezialisierung sehen wir die Vorverarbeitung in den Top 3. Aber komplexe Dinge wie die Entwicklung von ML-Modellen oder die Arbeit mit Big Data sind in den Top 3 äußerst selten - nur bei ML- und DWH-Ingenieuren.



Es gibt ein paar traurige Einsichten. 40% der Aufgaben stellen sich Experten. In Kasachstan haben bisher nur die führenden Einhornunternehmen die Vorteile der Arbeit mit Big Data getestet und gelernt, wie man dies kompetent macht. Sie senden auf den Markt, dass Big Data und maschinelles Lernen cool sind und die zweite Stufe folgt, aber sie verstehen nicht immer, wie die Arbeit mit Daten angeordnet ist. Daher sehen wir, dass die Experten Aufgaben für sich selbst festlegen und das Unternehmen nicht immer weiß, was es will.



Ich war überrascht, dass 20% der Spezialisten überhaupt nicht wissen, ob ihr Unternehmen über ein Data Warehouse verfügt. Ja, und mit Datenbankverwaltungssystemen ist nicht alles so gut - 41% verwenden MySQL und weitere 34% verwenden PostgreSQL. Worüber kann es reden? Sie arbeiten mehr mit kleinen Daten.



In der Frage nach Speichersystemen sehen wir wieder MySQL und sogar (!) Excel. Dies kann jedoch darauf hinweisen, dass die meisten Unternehmen einfach noch keine Anfrage für die Arbeit mit Big Data haben.



Alles hier ist wieder mehrdeutig. Im Allgemeinen waren die Gehälter etwas niedriger als ich erwartet hatte.



Persönlich fällt es mir schwer, mir einen ML-Ingenieur vorzustellen, der bereit ist, für 200.000 Tenge zu arbeiten - wahrscheinlich ist dies ein Praktikant. Entweder sind die Kompetenzen solcher Spezialisten sehr schwach, oder es ist für Unternehmen immer noch schwierig, die Arbeit von Data Science angemessen zu bewerten. Aber vielleicht deutet dies auch darauf hin, dass der Markt noch am Anfang seines Wachstums steht. Und im Laufe der Zeit wird die Höhe der Gehälter auf einem angemesseneren Niveau festgelegt.

Source: https://habr.com/ru/post/undefined/


All Articles