"Oui, ils existent!" Que font les spécialistes des sciences des données au Kazakhstan et combien gagnent-ils?

Dmitry Kazakov , chef d'équipe Data Analytics au sein du groupe Kolesa, partage les idées de la première enquête kazakhe auprès d'experts en données.


Sur la photo: Dmitry Kazakov

Rappelez-vous la phrase populaire selon laquelle le Big Data ressemble le plus au sexe des adolescents - tout le monde en parle, mais personne ne sait si c'est vraiment le cas. On pourrait en dire autant du marché des spécialistes des données (au Kazakhstan) - il y a un battage médiatique, mais qui est derrière ( et y a-t-il quelqu'un du tout ), ce n'était pas tout à fait clair - ni aux yeux ni aux gestionnaires , ni les données des scientifiques eux-mêmes.

Nous avons mené une étude dans laquelle nous avons interrogé plus de 300 spécialistes sur leurs salaires, fonctions, compétences, outils et bien plus encore.

Divulgacher:Oui, ils existent définitivement, mais tout n'est pas si simple.

Belle perspicacité. Premièrement, il y a plus de spécialistes des données que prévu. Nous avons réussi à interviewer 300 personnes, parmi lesquelles il y a non seulement des analystes produit, marketing et BI, mais aussi des ingénieurs ML, DWH, ce qui était particulièrement agréable. Dans le plus grand groupe se trouvaient tous ceux qui s'appellent des scientifiques des données - c'est 36% des répondants. Il est difficile de dire si cela couvre la demande du marché ou non, car le marché lui-même est en train de se former.



La répartition des niveaux d'emploi est embarrassante - il y a presque autant de chefs d'équipe et de chefs qu'il y a de dzhuns. Il peut y avoir plusieurs raisons à cela. Par exemple, un grand nombre de petites équipes de 2-3 personnes, dont la tête peut être un spécialiste de niveau intermédiaire ou supérieur.



Une autre raison peut être le chaos qui règne sur le marché en termes de normes dans la distribution des rôles et des fonctionnalités. Les timlids sont parfois désignés par ceux qui travaillent simplement pendant un an ou deux de plus que les autres, sans référence au niveau de compétences et de connaissances. Nous le constatons également dans la répartition des fonctions par poste - 38% des managers et chefs d'équipe sont engagés dans le prétraitement et 33% dans l'analyse statistique de base.





Ici, nous avons demandé aux répondants d'évaluer subjectivement le niveau d'analyse dans leur entreprise. Si vous regardez bien, vous pouvez voir que 10% des répondants qui travaillent dans les départements analytiques de 2-3 personnes pensent qu'ils ont un «niveau avancé».

Et qu'est-ce qu'un «niveau avancé»? Le système BI fonctionne bien. Il y a DWH et Big Data. Des tests A / B sont effectués régulièrement. Il existe des systèmes ML et DS en cours de production. Les décisions ne sont prises qu'en fonction des données. Le département de travail avec les données et la science des données est l'une des clés de l'entreprise.

Tout cela est presque impossible à réaliser avec un département de 2-3 personnes. Je crois qu'un tel résultat d'enquête est une petite maladie de croissance - les gars n'ont personne avec qui se comparer pour déterminer leur niveau plus objectivement.





On s'attend à ce que la plupart du temps, les spécialistes des données ne passent pas en mathématiques ou en ingénierie super complexes, mais en prétraitement, téléchargement et nettoyage des données. Dans chaque spécialisation, nous voyons le prétraitement dans le top 3. Mais les choses complexes comme le développement de modèles ML ou l'utilisation de Big Data sont extrêmement rares dans le top 3 - uniquement parmi les ingénieurs ML et DWH.



Il y a quelques tristes idées. 40% des tâches confiées aux experts. Au Kazakhstan, jusqu'à présent, seules les meilleures sociétés de licorne ont testé les avantages de travailler avec les mégadonnées et ont appris à le faire avec compétence. Ils diffusent sur le marché que le Big Data et le Machine Learning sont cool, et le deuxième niveau suit, mais loin de toujours comprendre comment le travail avec les données est organisé. Par conséquent, nous constatons que les experts se fixent des tâches et que l'entreprise ne sait pas toujours ce qu'elle veut.



J'ai été surpris que 20% des spécialistes ne sachent pas du tout si leur entreprise dispose d'un Data Warehouse. Oui, et avec les systèmes de gestion de bases de données, tout n'est pas si bon - 41% utilisent MySQL et 34% utilisent PostgreSQL. De quoi peut-il parler? Ils travaillent davantage avec de petites données.



Dans la question sur les systèmes de stockage, nous voyons à nouveau MySQL et même (!) Excel. Mais cela peut indiquer, par exemple, que la plupart des entreprises n'ont tout simplement pas encore de demande pour travailler avec les mégadonnées.



Ici, tout est à nouveau ambigu. En général, les salaires étaient légèrement inférieurs à mes attentes.



Personnellement, j’ai du mal à imaginer un ingénieur ML prêt à travailler pour 200 000 tenges - probablement un stagiaire. Soit les compétences de ces spécialistes sont très faibles, soit il est encore difficile pour les entreprises d'évaluer adéquatement le travail de Data Science. Mais cela suggère peut-être aussi que le marché est encore au tout début de sa croissance. Et au fil du temps, le niveau des salaires sera fixé à un niveau plus adéquat.

Source: https://habr.com/ru/post/undefined/


All Articles