Yandex.Practicum - Analyste de données. L'obtention du diplôme

Le premier article est ici.

La formation chez Yandex.Practicum est terminée, un certificat a été reçu et vous pouvez résumer la formation.


De plus, après le premier article, beaucoup avaient des questions supplémentaires, donc je voulais y répondre et montrer un peu de pratique. Les cas ont été assez maîtrisés, donc dans le cadre d'un article, cela ne fonctionnera pas pour tout couvrir.

Tout d'abord, je veux décrire ce qui s'est passé dans la formation après avoir écrit le premier article. Ce que je voudrais décrire séparément.

tout d'abord,


Le cours «Automatisation» s'est avéré être le plus difficile pour moi personnellement - sur l'automatisation des processus d'analyse de données (scripts, tableaux de bord, etc.), la qualité du matériel de formation était complètement hors de propos.

Il s'agissait de pannes purement techniques de la catégorie - «Moi, quelque chose cliqué et tout s'est éteint» :)
(incompatibilité des versions logicielles, problèmes avec le matériel), a provoqué une violation des délais de travail. Il s'est également avéré que je n'avais pratiquement aucune expérience avec la ligne de commande, mais j'ai dû apprendre d'urgence ...


Dans le cadre de ce sujet, nous avons acquis une expérience de travail sur une machine virtuelle dans Yandex.Cloud :

, . , , , . , (CLI), API SDK.


-,


J'ai été impressionné par le cours avec le titre séduisant "Forecasts and Predictions" (machine learning). Il s'est avéré être très important, l'analyste doit avoir une compréhension de l'apprentissage automatique, bien que cela soit plus pertinent pour la science des données. Je dirai tout de suite que j'ai aimé l'idée d'introduire les conclusions analytiques obtenues immédiatement dans la pratique, parce que j'aime le cycle complet de travail et moins la séparation des processus, meilleur est le résultat (il y a cependant quelques difficultés à cela).

Le cours se compose de 3 grands blocs:

  • tâches d'apprentissage automatique en entreprise,
  • algorithmes d'apprentissage automatique,
  • le processus de résolution des problèmes d'apprentissage automatique.

Troisièmement,


Le projet de fin d'études a eu lieu dans Yandex.Tracker - un système de gestion des tâches et des processus afin que les étudiants se plongent dans le processus de travail, comme dans une vraie entreprise.


Chaque étudiant a réalisé son projet et envoyé des rapports au Tracker, des tâches inattendues sont également arrivées. Ce fut une expérience intéressante, mais il était difficile d'évaluer le délai dans de vraies entreprises (pour combien de temps habituellement un projet se fait dans la vie).

Et le dernier travail d'examen par les pairs de Peergrade est une plate-forme en ligne pour mener des sessions de rétroaction des étudiants. Là, nous avons évalué l'une des tâches de chacun sur le projet.

Quatrième,


vraiment aimé le programme de placement. Vous pouvez être un bon spécialiste, mais vous ne comprenez pas du tout ce qui doit être fait pour vous présenter correctement et adéquatement. Il me semblait qu'ayant le portefeuille en main, avec le travail terminé, l'employeur regarderait tout, nous parlerions, et le processus serait raccourci pour tout le monde, mais il s'est avéré que personne ne regardait les projets. Dans la plupart des cas, tout commence par le service des ressources humaines et vous devez donc avoir un curriculum vitae et une lettre de motivation normaux, ainsi que de nombreuses autres subtilités. Par conséquent, de façon inattendue pour moi, ce programme était extrêmement utile.

résultats


Vous serez un spécialiste tout fait à la sortie si vous avez de l'expérience dans un certain domaine où vous pouvez non seulement appliquer les outils que vous avez appris, mais aussi être capable d'interpréter le résultat et, idéalement, de le mettre en œuvre.

Yandex.Practicum ne vous fournira que des outils d'analyse, et vous pouvez vraiment apprendre des outils à partir de zéro (par exemple, après avoir obtenu votre diplôme), mais il est peu probable d'interpréter le résultat, car il existe une formation ou une expérience spécialisée dans un certain domaine.


Dans notre pays, l'atelier est un peu en avance sur le calendrier, car il s'est avéré que pour tant de postes vacants, vous aurez parfaitement besoin d'Excel :). Apparemment, les employeurs ont du mal à passer à d'autres outils de données.

Permettez-moi de vous rappeler que notre flux a été le premier, et j'ai compris qu'il y aurait des difficultés techniques et que les développeurs du cours apprendraient également dans une certaine mesure de notre part.

Le principal inconvénient pour moi était le "facteur humain". Plus tard, en analysant mes projets terminés, j'ai découvert plusieurs erreurs que les enseignants auraient dû me signaler. Et en général, on a estimé que les enseignants n'avaient pas assez de temps pour vérifier, j'attribue tout cela à un nouveau produit et nous résolvons complètement ce problème. De plus, les gars qui font le cours essaient très fort de créer un super produit, par exemple, le sujet "Prévisions et prévisions" a été complètement mis à jour et est devenu beaucoup plus compréhensible et complet. Je recommence.

Il y avait aussi des contradictions dans les recommandations sur l'application de certaines méthodes de différents enseignants, de différents points de vue.

Outils d'apprentissage


( quoi de mieux d'avoir une idée avant le début des cours pour gagner du temps, surtout si vous travaillez en parallèle ):

  • Python , c'est mieux si vous avez une idée de la langue avant de commencer les cours. Il y a un cours d'introduction, mais d'autres cours d'introduction ne feraient pas de mal non plus;
  • Jupyter Notebook , également préférable de lire avant les cours;
  • SQL est requis presque partout, tout ce dont vous avez besoin pour commencer a été définitivement donné, c'est maintenant une question de pratique;
  • analyse statistique , je vous recommande fortement de commencer les « Fondements de la statistique » sur Stepik avec Anatoly Karpov avant de commencer ,


    , « » . « » « . 2 3.» .

:

  • - ( , , -, );
  • , (/-);
  • , (, , );
  • ( , , , , , );
  • apprentissage automatique, sklearn (pré-traitement, construction de modèles, classification, choix du meilleur modèle), mais il s'agit tout de même d'un cours plutôt court, et ceux qui veulent travailler dans ce domaine auront besoin d'un cours plus avancé, par exemple de Yandex

Et aussi, si c'était il y a longtemps ou si vous ne savez rien du tout sur la théorie des probabilités, regardez au moins les leçons de GetAClass, d'abord sur la combinatoire , puis sur la théorie des probabilités .

Inutile de dire anglais.

Dans la deuxième partie de l'article, je montrerai l'application pratique des connaissances acquises pour l'analyse de la recherche: une campagne publicitaire dans Yandex.Direct, des visites sur le site, et l'identification d'une éventuelle fraude. Sur les données collectées sur 6,5 ans.

All Articles