Yandex.Practicum - Datenanalyst. Abschluss

Der erste Artikel ist hier.

Die Schulung bei Yandex.Practicum ist beendet, ein Zertifikat wurde erhalten und Sie können die Schulung zusammenfassen.


Außerdem hatten viele nach dem ersten Artikel zusätzliche Fragen, deshalb wollte ich sie beantworten und ein wenig Übung zeigen. Fälle wurden ziemlich oft gemeistert, daher wird es im Rahmen eines Artikels nicht funktionieren, alles abzudecken.

Zunächst möchte ich beschreiben, was in der Schulung nach dem Schreiben des ersten Artikels passiert ist. Was ich separat beschreiben möchte.

Erstens,


Der Kurs „Automatisierung“ erwies sich für mich persönlich als der schwierigste - bei der Automatisierung von Datenanalyseprozessen (Skripte, Dashboards usw.) war die Qualität des Schulungsmaterials völlig irrelevant.

Dies waren rein technische Fehler aus der Kategorie „Ich habe etwas gedrückt und alles ging aus“ :)
(Inkompatibilität von Softwareversionen, Probleme mit der Ausrüstung) verursachte einen Verstoß gegen die Fristen für die Arbeit. Es stellte sich auch heraus, dass ich praktisch keine Erfahrung mit der Kommandozeile hatte, aber ich musste dringend lernen ...


Im Rahmen dieses Themas haben wir Erfahrungen mit der Arbeit an einer virtuellen Maschine in Yandex.Cloud gesammelt :

, . , , , . , (CLI), API SDK.


-,


Der Kurs beeindruckte mich mit dem verführerischen Titel „Prognosen und Vorhersagen“ (maschinelles Lernen). Es stellte sich als sehr wichtig heraus, dass der Analyst ein Verständnis für maschinelles Lernen haben muss, obwohl dies für Data Science relevanter ist. Ich werde gleich sagen, dass mir die Idee gefallen hat, die erhaltenen analytischen Schlussfolgerungen sofort in die Praxis umzusetzen, weil mir der gesamte Arbeitszyklus und je weniger die Trennung der Prozesse gefällt, desto besser ist das Ergebnis (es gibt jedoch einige Schwierigkeiten).

Der Kurs besteht aus 3 großen Blöcken:

  • maschinelle Lernaufgaben in der Wirtschaft,
  • Algorithmen für maschinelles Lernen,
  • der Prozess der Lösung von Problemen des maschinellen Lernens.

Drittens,


Das Abschlussprojekt fand in Yandex.Tracker statt - einem Aufgaben- und Prozessmanagementsystem, mit dem die Schüler wie in einem echten Unternehmen in den Arbeitsprozess eintauchen konnten.


Jeder Schüler führte sein Projekt durch und schickte Berichte an den Tracker. Es kamen auch unerwartete Aufgaben an. Es war eine interessante Erfahrung, aber es war schwierig, die Frist in realen Unternehmen zu bewerten (wie lange normalerweise ein Projekt im Leben durchgeführt wird).

Und der letzte Peer- Review-Job bei Peergrade ist eine Online-Plattform für die Durchführung von Feedback-Sitzungen für Schüler. Dort haben wir eine der Aufgaben des Projekts bewertet.

Viertens,


Das Vermittlungsprogramm hat mir sehr gut gefallen. Sie können ein guter Spezialist sein, verstehen aber überhaupt nicht, was zu tun ist, um sich korrekt und angemessen zu präsentieren. Es schien mir, dass der Arbeitgeber mit dem Portfolio in der Hand und der fertigen Arbeit alles betrachten würde, wir würden reden und der Prozess würde für alle verkürzt werden, aber es stellte sich heraus, dass niemand die Projekte betrachtete. In den meisten Fällen beginnt alles mit der Personalabteilung. Daher sollten Sie einen normalen Lebenslauf und ein Anschreiben sowie viele andere Feinheiten haben. Daher war dieses Programm für mich unerwartet äußerst nützlich.

Ergebnisse


Sie sind am Ausgang ein vorgefertigter Spezialist, wenn Sie Erfahrung in einem bestimmten Bereich haben, in dem Sie die erlernten Werkzeuge nicht nur anwenden, sondern auch das Ergebnis interpretieren und im Idealfall auch umsetzen können.

Yandex.Practicum bietet Ihnen nur Werkzeuge für die Analyse, und Sie können wirklich Werkzeuge von Grund auf lernen (zum Beispiel nach dem Schulabschluss), aber es ist unwahrscheinlich, dass das Ergebnis interpretiert wird, da dies eine spezielle Ausbildung oder Berufserfahrung in einem bestimmten Bereich gibt.


In unserem Land ist der Workshop etwas früher als geplant, da sich herausstellte, dass Sie für so viele offene Stellen Excel perfekt benötigen :). Offensichtlich haben Arbeitgeber Schwierigkeiten, auf andere Datentools umzusteigen.

Ich möchte Sie daran erinnern, dass unser Ablauf der erste war, und ich habe verstanden, dass es technische Schwierigkeiten geben würde und die Entwickler des Kurses in gewissem Umfang auch von uns lernen würden.

Der Hauptnachteil für mich war der "menschliche Faktor". Später, als ich meine abgeschlossenen Projekte analysierte, entdeckte ich einige Fehler, auf die mich die Lehrer hätten hinweisen sollen. Und im Allgemeinen hatte man das Gefühl, dass die Lehrer nicht genug Zeit hatten, um dies zu überprüfen. Ich schreibe dies alles einem neuen Produkt zu und wir lösen dieses Problem vollständig. Darüber hinaus bemühen sich die Teilnehmer des Kurses sehr, ein Superprodukt zu entwickeln. Beispielsweise wurde das Thema "Prognosen und Vorhersagen" vollständig aktualisiert und ist viel verständlicher und vollständiger geworden. Ich gehe es noch einmal durch.

Es gab auch Widersprüche in den Empfehlungen zur Anwendung bestimmter Methoden von verschiedenen Lehrern, verschiedenen Standpunkten.

Lernwerkzeuge


( Was ist besser, wenn Sie vor Beginn des Unterrichts eine Idee haben, um Zeit zu sparen, insbesondere wenn Sie parallel arbeiten ):

  • Python , es ist besser, wenn Sie vor Beginn des Unterrichts eine Vorstellung von der Sprache haben. Es gibt einen Einführungskurs, aber auch andere Einführungskurse würden nicht schaden.
  • Jupyter Notebook , auch besser vor dem Unterricht zu lesen ;
  • SQL wird fast überall benötigt, alles, was Sie brauchen, um loszulegen, wurde definitiv gegeben, jetzt ist es eine Frage der Übung;
  • statistische Analyse , ich empfehle dringend, dass Sie mit Anatoly Karpov die " Grundlagen der Statistik " auf Stepik durchgehen, bevor Sie beginnen ,


    , « » . « » « . 2 3.» .

:

  • - ( , , -, );
  • , (/-);
  • , (, , );
  • ( , , , , , );
  • maschinelles Lernen, sklearn (Vorverarbeitung, Modellbildung, Klassifizierung, Auswahl des besten Modells), aber dies ist immer noch ein ziemlich kurzer Kurs, und diejenigen, die in diesem Bereich arbeiten möchten, benötigen einen fortgeschritteneren Kurs, zum Beispiel von Yandex

Und wenn es schon lange her ist oder Sie überhaupt nichts über Wahrscheinlichkeitstheorie wissen, schauen Sie sich zumindest die Lehren aus GetAClass zuerst zur Kombinatorik und dann zur Wahrscheinlichkeitstheorie an .

Unnötig zu sagen, Englisch.

Im zweiten Teil des Artikels werde ich die praktische Anwendung des für die Forschungsanalyse gewonnenen Wissens zeigen: eine Werbekampagne in Yandex.Direct, Besuche auf der Website und Identifizierung eines möglichen Betrugs. Auf Daten über 6,5 Jahre gesammelt.

All Articles