“是的,它们存在!” 哈萨克斯坦的数据科学专家做什么,他们能赚多少钱?

Kolesa集团数据分析团队负责人Dmitry Kazakov分享了哈萨克斯坦第一次数据专家调查的见解。


在照片中:德米特里·卡扎科夫(Dmitry Kazakov)

记住大数据最类似于青少年性的流行短语-每个人都在谈论它,但没人知道它是否真的如此。关于数据专家的市场(在哈萨克斯坦),可以说是一样的-有炒作,但背后谁(至少在那儿有人),尚不完全清楚-既没有专家,也没有管理人员,也不是科学家本身的数据。

我们进行了一项研究,采访了300多位专家,他们的薪水,职能,技能,工具等等。

扰流板:是的,它们确实存在,但是一切都不那么简单。

很好的见识。首先,数据专家比我们预期的要多。我们设法采访了300人,其中不仅有产品,市场营销和BI分析师,而且还有ML,DWH工程师,这尤其令人愉悦。在最大的群体中,所有自称数据科学家的人-占受访者的36%。很难说这是否满足市场需求,因为市场本身只是在形成。



工作级别的分配令人尴尬-团队领导者和领导者的数量几乎与dzhuns一样多。可能有几个原因。例如,由2-3人组成的大量小团队,其中负责人可以是中高级专家。



另一个原因可能是在角色和功能分配的标准方面,市场上混乱不堪。提姆利犬有时是由仅仅比其他人多工作一两年的人任命的,而没有提及技能和知识水平。在按职位划分的职能分布中,我们也看到了这一点-38%的经理和团队负责人从事预处理,另有33%从事基本统计分析。





在这里,我们要求受访者主观评估其公司的分析水平。如果仔细观察,您会发现在2-3个人的分析部门中工作的受访者中有10%认为他们具有“高级水平”。

什么是“高级水平”? BI系统工作正常。有DWH和大数据。定期进行A / B测试。生产中正在运行的ML和DS系统。仅根据数据做出决定。数据和数据科学部门是公司的关键之一。

由2-3人组成的部门几乎不可能实现上述所有目标。我认为,这样的调查结果是一种小小的成长疾病-没人能与他们进行比较,以便更客观地确定自己的水平。





可以预期的是,大多数时候数据专家不会花在超级复杂的数学或工程上,而是花在预处理,上传和清理数据上。在每个专业领域中,我们都在前3个中看到预处理。但是,开发ML模型或使用大数据之类的复杂事情在前三名中极为罕见-仅在ML和DWH工程师中。



有一些可悲的见解。专家设定了40%的任务。在哈萨克斯坦,到目前为止,只有顶级独角兽公司测试了使用大数据的好处,并学会了如何胜任。他们向市场广播大数据和机器学习很酷,并且紧随其后的是第二层,但是他们并不总是了解如何处理数据。因此,我们看到专家为自己设置任务,而业务并不总是知道自己想要什么。



令我惊讶的是,有20%的专家根本不知道他们的公司是否有数据仓库。是的,在数据​​库管理系统中,并不是一切都那么好-41%的用户使用MySQL,另外34%的用户使用PostgreSQL。它能说什么呢?他们可以处理少量数据。



在有关存储系统的问题中,我们再次看到MySQL甚至(!)Excel。但这可能表明,例如,大多数公司根本还没有处理大数据的要求。



这里的一切再次变得模棱两可。总的来说,薪水比我预期的要低。



就我个人而言,很难想象有一位准备以20万坚戈工作的机器学习工程师-可能是实习生。这类专家的能力很弱,或者公司仍然难以充分评估数据科学的工作。但这也许也暗示着市场仍处于成长初期。随着时间的流逝,工资水平将被确定为更适当的水平。

Source: https://habr.com/ru/post/undefined/


All Articles