Yandex.Practicum - Analista de datos. Graduación

El primer artículo está aquí.

La capacitación en Yandex.Practicum ha finalizado, se recibió un certificado y puede resumir la capacitación.


Además, después del primer artículo, muchos tenían preguntas adicionales, así que quería responderlas y mostrar un poco de práctica. Los casos se han dominado bastante, por lo que en el marco de un artículo, no funcionará para cubrir todo.

En primer lugar, quiero describir lo que sucedió en el entrenamiento después de escribir el primer artículo. Lo que me gustaría describir por separado.

Primeramente,


El curso de "Automatización" resultó ser el más difícil para mí personalmente: en la automatización de los procesos de análisis de datos (scripts, paneles, etc.), la calidad del material de capacitación resultó ser completamente irrelevante.

Estas fueron fallas puramente técnicas de la categoría: "Yo, algo hizo clic y todo salió" :)
(incompatibilidad de versiones de software, problemas con el equipo), causó una violación de los plazos para el trabajo. También resultó que prácticamente no tenía experiencia con la línea de comando, pero tenía que aprender con urgencia ...


Como parte de este tema, ganamos experiencia trabajando en una máquina virtual en Yandex .

, . , , , . , (CLI), API SDK.


-,


El curso me impresionó con el atractivo título "Pronósticos y predicciones" (aprendizaje automático). Resultó ser muy importante, el analista debe tener una comprensión del aprendizaje automático, aunque esto es más relevante para Data Science. Diré de inmediato que me gustó la idea de introducir las conclusiones analíticas obtenidas de inmediato en la práctica, porque me gusta el ciclo completo de trabajo y cuanto menor sea la separación de los procesos, mejor será el resultado (sin embargo, hay algunas dificultades en eso).

El curso consta de 3 bloques grandes:

  • tareas de aprendizaje automático en negocios,
  • algoritmos de aprendizaje automático,
  • El proceso de resolución de problemas de aprendizaje automático.

En tercer lugar,


El proyecto de graduación se llevó a cabo en Yandex.Tracker , un sistema de gestión de tareas y procesos para que los estudiantes se sumergieran en el proceso de trabajo, como en una empresa real.


Cada estudiante llevó a cabo su proyecto y envió informes al Rastreador, también llegaron tareas inesperadas. Fue una experiencia interesante, pero fue difícil evaluar el plazo de tiempo en empresas reales (durante cuánto tiempo se suele realizar un proyecto en la vida).

Y el último trabajo de revisión por pares en Peergrade es una plataforma en línea para realizar sesiones de comentarios de los estudiantes. Allí evaluamos una de las tareas de cada uno en el proyecto.

Cuarto,


Realmente me gustó el programa de inserción laboral. Puede ser un buen especialista, pero no comprende en absoluto lo que debe hacerse para presentarse de manera correcta y adecuada. Me pareció que con el portafolio en mano, con el trabajo terminado, el empleador miraría todo, hablaríamos y el proceso se acortaría para todos, pero resultó que nadie estaba mirando los proyectos. En la mayoría de los casos, todo comienza con el departamento de recursos humanos y, por lo tanto, debe tener un currículum normal y una carta de presentación, y muchas otras sutilezas. Por lo tanto, inesperadamente para mí, este programa fue extremadamente útil.

recomendaciones


Serás un especialista listo a la salida si tienes experiencia en un campo determinado en el que no solo puedes aplicar las herramientas que has aprendido, sino que también puedes interpretar el resultado e, idealmente, también implementarlo.

Yandex.Practicum solo le dará herramientas para el análisis, y realmente puede aprender herramientas desde cero (por ejemplo, después de graduarse de la escuela), pero es poco probable que interprete el resultado, para esto hay una educación especializada o experiencia laboral en un campo determinado.


En nuestro país, el Taller está un poco adelantado, ya que resultó que para tantas vacantes necesitará Excel perfectamente :). Aparentemente, los empleadores tienen dificultades para pasar a otras herramientas de datos.

Permítanme recordarles que nuestro flujo fue el primero, y entendí que habría dificultades técnicas y que los desarrolladores del curso también aprenderían en cierta medida de nosotros.

La principal desventaja para mí fue el "factor humano". Más tarde, al analizar mis proyectos completados, descubrí varios errores que los maestros deberían haberme señalado. Y, en general, se consideró que los maestros no tenían tiempo suficiente para verificar, atribuyo todo esto a un nuevo producto y resolvemos completamente este problema. Además, los chicos que hacen el curso se esfuerzan mucho para hacer un super producto, por ejemplo, el tema "Pronósticos y predicciones" se ha actualizado por completo y se ha vuelto mucho más comprensible y completo. Lo reviso de nuevo.

También hubo contradicciones en las recomendaciones sobre la aplicación de ciertos métodos de diferentes maestros, diferentes puntos de vista.

Herramientas de aprendizaje


( lo que es mejor tener una idea antes del comienzo de las clases para ahorrar tiempo, especialmente si trabaja en paralelo ):

  • Python , es mejor si tienes una idea del idioma antes de comenzar las clases. Hay un curso introductorio, pero otros cursos introductorios tampoco harían daño;
  • Cuaderno Jupyter , también mejor leer antes de las clases;
  • SQL se requiere en casi todas partes, todo lo que necesita para comenzar definitivamente se le dio, ahora es una cuestión de práctica;
  • análisis estadístico , le recomiendo que comience los " Fundamentos de estadística " en Stepik con Anatoly Karpov antes de comenzar ,


    , « » . « » « . 2 3.» .

:

  • - ( , , -, );
  • , (/-);
  • , (, , );
  • ( , , , , , );
  • machine learning, sklearn (preprocesamiento, construcción de modelos, clasificación, elección del mejor modelo), pero aún así este es un curso bastante corto, y aquellos que quieran trabajar en esta área necesitarán un curso más avanzado, por ejemplo de Yandex

Y también, si fue hace mucho tiempo o no sabes nada sobre teoría de la probabilidad, mira al menos las lecciones de GetAClass, primero sobre combinatoria , luego sobre teoría de probabilidad .

No hace falta decir inglés.

En la segunda parte del artículo, mostraré la aplicación práctica de los conocimientos adquiridos para el análisis de investigación: una campaña publicitaria en Yandex.Direct, visitas al sitio e identificación de un posible fraude. Sobre los datos recopilados durante 6,5 años.

All Articles