Yandex.Practicum - Analista de Dados. Graduação

O primeiro artigo está aqui.

O treinamento no Yandex.Practicum terminou, um certificado foi recebido e você pode resumir o treinamento.


Além disso, após o primeiro artigo, muitos tinham perguntas adicionais, então eu queria respondê-las e mostrar um pouco de prática. Os casos foram dominados bastante; portanto, na estrutura de um artigo, tudo não pode ser coberto.

Antes de tudo, quero descrever o que aconteceu no treinamento depois de escrever o primeiro artigo. O que eu gostaria de descrever separadamente.

Primeiramente,


O curso "Automação" acabou sendo o mais difícil para mim pessoalmente - na automação dos processos de análise de dados (scripts, painéis etc.), a qualidade do material de treinamento era completamente irrelevante.

Foram falhas puramente técnicas da categoria - “eu, algo clicou e tudo saiu” :)
(incompatibilidade de versões de software, problemas com o equipamento), causou uma violação dos prazos para o trabalho. Também aconteceu que eu praticamente não tinha experiência com a linha de comando, mas precisava aprender urgentemente ...


Como parte deste tópico, adquirimos experiência trabalhando em uma máquina virtual no Yandex.Cloud :

, . , , , . , (CLI), API SDK.


-,


Fiquei impressionado com o curso com o título atraente "Previsões e previsões" (aprendizado de máquina). Acabou sendo muito importante, o analista deve ter um entendimento do aprendizado de máquina, embora isso seja mais relevante para a Ciência de Dados. Eu direi imediatamente que gostei da ideia de apresentar as conclusões analíticas obtidas imediatamente na prática, porque gosto de todo o ciclo de trabalho e quanto menor a separação de processos, melhor o resultado (no entanto, existem algumas dificuldades).

O curso consiste em 3 grandes blocos:

  • tarefas de aprendizado de máquina nos negócios,
  • algoritmos de aprendizado de máquina,
  • o processo de resolver problemas de aprendizado de máquina.

Em terceiro lugar,


O projeto de graduação foi realizado no Yandex.Tracker - um sistema de gerenciamento de tarefas e processos, para que os alunos mergulhem no processo de trabalho, como em uma empresa real.


Cada aluno realizou seu projeto e enviou relatórios ao Tracker, tarefas inesperadas também chegaram. Foi uma experiência interessante, mas foi difícil avaliar o prazo em empresas reais (por quanto tempo geralmente um projeto é realizado na vida).

E o último trabalho de revisão por pares da Peergrade é uma plataforma on-line para a realização de sessões de feedback dos alunos. Lá, avaliamos uma das tarefas uma da outra no projeto.

Quarto,


realmente gostei do programa de estágio. Você pode ser um bom especialista, mas não entende o que precisa ser feito para se apresentar de maneira correta e adequada. Pareceu-me que, tendo o portfólio em mãos, com o trabalho concluído, o empregador examinaria tudo, conversaríamos e o processo seria reduzido para todos, mas verificou-se que ninguém estava olhando para os projetos. Na maioria dos casos, tudo começa com o departamento de RH e, portanto, você deve ter um currículo e uma carta de apresentação normais, além de muitas outras sutilezas. Portanto, inesperadamente para mim, este programa foi extremamente útil.

achados


Você será um especialista pronto na saída, se tiver experiência em um determinado campo em que não apenas possa aplicar as ferramentas que aprendeu, mas também será capaz de interpretar o resultado e, idealmente, implementá-lo.

O Yandex.Practicum fornecerá apenas ferramentas para análise e você poderá realmente aprender ferramentas do zero (por exemplo, depois de se formar na escola), mas é improvável que interprete o resultado, pois há uma educação ou experiência especializada em um determinado campo.


Em nosso país, o Workshop está um pouco adiantado, pois, para tantas vagas, você precisará do Excel perfeitamente :). Aparentemente, os empregadores estão tendo dificuldade em mudar para outras ferramentas de dados.

Deixe-me lembrá-lo de que nosso fluxo foi o primeiro, e eu entendi que haveria alguma dificuldade técnica e os desenvolvedores do curso também aprenderiam até certo ponto conosco.

A principal desvantagem para mim foi o "fator humano". Mais tarde, analisando meus projetos concluídos, descobri vários erros que os professores deveriam ter apontado para mim. E, em geral, considerou-se que os professores não tinham tempo suficiente para verificar, atribuo tudo isso a um novo produto e resolvemos completamente esse problema. Além disso, os participantes do curso estão se esforçando muito para criar um super produto, por exemplo, o tópico "Previsões e previsões" foi completamente atualizado e tornou-se muito mais compreensível e completo. Eu passo por isso novamente.

Também houve contradições nas recomendações sobre a aplicação de certos métodos de diferentes professores, diferentes pontos de vista.

Ferramentas de aprendizado


( é melhor ter uma ideia antes do início das aulas para economizar tempo, principalmente se você trabalha em paralelo ):

  • Python , é melhor se você tiver uma idéia da linguagem antes de iniciar as aulas. Existe um curso introdutório, mas outros cursos introdutórios também não prejudicariam;
  • Jupyter Notebook , também é melhor ler antes das aulas;
  • O SQL é necessário em quase todos os lugares, tudo o que você precisa para começar foi definitivamente dado, agora é uma questão de prática;
  • Para análise estatística , eu recomendo fortemente que você inicie os " Fundamentos da estatística " no Stepik com Anatoly Karpov antes de iniciar ,


    , « » . « » « . 2 3.» .

:

  • - ( , , -, );
  • , (/-);
  • , (, , );
  • ( , , , , , );
  • aprendizado de máquina, sklearn (pré-processamento, construção de modelo, classificação, escolha do melhor modelo), mas ainda é um curso bastante curto, e aqueles que desejam trabalhar nessa área precisarão de um curso mais avançado, por exemplo, do Yandex

E também, se foi há muito tempo ou você não conhece nada sobre teoria das probabilidades, veja pelo menos as lições do GetAClass, primeiro sobre combinatória , depois sobre teoria das probabilidades .

Escusado será dizer que inglês.

Na segunda parte do artigo, mostrarei a aplicação prática do conhecimento adquirido para a análise da pesquisa: uma campanha publicitária no Yandex.Direct, visitas ao site e identificação de uma possível fraude. Em dados coletados acima de 6,5 anos.

All Articles