"¡Sí, existen!" ¿Qué hacen los especialistas en ciencia de datos en Kazajstán y cuánto ganan?

Dmitry Kazakov , líder del equipo de análisis de datos en el Grupo Kolesa, comparte ideas de la primera encuesta de expertos en datos de Kazajstán.


En la foto: Dmitry Kazakov

Recuerde la frase popular que Big Data se asemeja más al sexo adolescente: todos hablan de ello, pero nadie sabe si realmente lo es. Lo mismo podría decirse sobre el mercado de especialistas en datos (en Kazajstán): hay una exageración, pero quién está detrás de esto ( y hay alguien en absoluto ), no estaba completamente claro, ni para eychars ni para gerentes , ni los datos de los propios científicos.

Realizamos un estudio en el que entrevistamos a más de 300 especialistas sobre sus salarios, funciones, habilidades, herramientas y mucho más.

Revelación:Sí, definitivamente existen, pero no todo es tan simple.

Buena idea En primer lugar, hay más especialistas en datos de los que esperábamos. Logramos entrevistar a 300 personas, entre las cuales no solo había analistas de productos, marketing y BI, sino también ingenieros de ML, DWH, lo que fue especialmente agradable. En el grupo más grande estaban todos los que se autodenominan científicos de datos: esto es el 36% de los encuestados. Es difícil decir si esto cubre la demanda del mercado o no, porque el mercado en sí solo se está formando.



La distribución de los niveles de trabajo es vergonzosa: hay casi tantos líderes de equipo y líderes como dzhuns. Puede haber varias razones para esto. Por ejemplo, una gran cantidad de pequeños equipos de 2-3 personas, en los cuales el jefe puede ser un especialista en el nivel medio o superior.



Otra razón puede ser el caos que prevalece en el mercado en términos de estándares en la distribución de roles y funcionalidades. Los tílidos a veces son designados por aquellos que simplemente trabajan durante un año o dos más que otros, sin referencia al nivel de habilidades y conocimientos. También vemos esto en la distribución de funciones por puesto: el 38% de los gerentes y líderes de equipo se dedican al preprocesamiento y otro 33% se dedica al análisis estadístico básico.





Aquí les pedimos a los encuestados que evalúen subjetivamente el nivel de análisis en sus empresas. Si observa de cerca, puede ver que el 10% de los encuestados que trabajan en los departamentos analíticos de 2-3 personas piensan que tienen un "nivel avanzado".

¿Y qué es un "nivel avanzado"? El sistema de BI funciona bien. Hay DWH y Big Data. Las pruebas A / B se realizan regularmente. Hay sistemas ML y DS en funcionamiento en producción. Las decisiones se toman solo de acuerdo con los datos. El departamento de trabajo con datos y ciencia de datos es una de las claves de la empresa.

Todo lo anterior es casi imposible de lograr con un departamento de 2-3 personas. Creo que el resultado de una encuesta de este tipo es una pequeña enfermedad de crecimiento: los hombres no tienen con quién compararse para determinar su nivel de manera más objetiva.





Se espera que la mayoría de las veces los especialistas en datos no gasten en matemáticas o ingeniería súper complejas, sino en preprocesamiento, carga y limpieza de datos. En cada especialización, vemos el preprocesamiento en los 3 primeros. Pero cosas complejas como desarrollar modelos de ML o trabajar con Big Data son extremadamente raros entre los 3 primeros, solo entre los ingenieros de ML y DWH.



Hay un par de ideas tristes. 40% de las tareas que los expertos se asignan. En Kazajstán, hasta ahora solo las principales compañías de unicornios han probado los beneficios de trabajar con big data y han aprendido cómo hacerlo de manera competente. Transmitieron al mercado que Big Data y Machine Learning son geniales, y el segundo nivel sigue, pero no siempre entienden cómo se organiza el trabajo con datos. Por lo tanto, vemos que los expertos establecen tareas para sí mismos, y la empresa no siempre sabe lo que quiere.



Me sorprendió que el 20% de los especialistas no sepan en absoluto si su empresa tiene un Data Warehouse. Sí, y con los sistemas de administración de bases de datos, no todo es tan bueno: el 41% usa MySQL y otro 34% usa PostgreSQL. ¿De qué puede hablar? Trabajan más con datos pequeños.



En la pregunta sobre sistemas de almacenamiento, nuevamente vemos MySQL e incluso (!) Excel. Pero esto puede indicar, por ejemplo, que la mayoría de las empresas simplemente aún no tienen una solicitud para trabajar con Big Data.



Todo aquí es nuevamente ambiguo. En general, los salarios fueron ligeramente más bajos de lo que esperaba.



Personalmente, es difícil para mí imaginarme un ingeniero de ML que esté listo para trabajar por 200 mil tenge, probablemente este sea un interno. O las competencias de dichos especialistas son muy débiles, o aún es difícil para las empresas evaluar adecuadamente el trabajo de Data Science. Pero quizás esto también sugiera que el mercado todavía está en el comienzo de su crecimiento. Y con el tiempo, el nivel de los salarios se establecerá en un nivel más adecuado.

Source: https://habr.com/ru/post/undefined/


All Articles