"نعم ، إنهم موجودون!" ماذا يفعل متخصصو علوم البيانات في كازاخستان وكم يكسبون؟

يشارك ديميتري كازاكوف ، رئيس فريق تحليلات البيانات في مجموعة Kolesa ، رؤى من أول استطلاع أجرته كازاخستان لخبراء البيانات.


في الصورة: دميتري كازاكوف

تذكر العبارة الشائعة التي تشبه البيانات الضخمة إلى حد كبير الجنس في سن المراهقة - الجميع يتحدث عنه ، ولكن لا أحد يعرف ما إذا كان كذلك بالفعل. يمكن قول الشيء نفسه عن سوق متخصصي البيانات (في كازاخستان) - هناك ضجيج ، ولكن من يقف وراءها ( وهل هناك أي شخص على الإطلاق ) ، لم يكن واضحًا تمامًا - لا لفت الانتباه ولا للمديرين ، ولا بيانات العلماء أنفسهم.

لقد أجرينا دراسة أجرينا فيها مقابلات مع أكثر من 300 متخصص حول رواتبهم ووظائفهم ومهاراتهم وأدواتهم وأكثر من ذلك بكثير.

المفسد:نعم ، إنهم موجودون بالتأكيد ، لكن كل شيء ليس بهذه البساطة.

بصيرة جميلة. أولاً ، هناك متخصصون في البيانات أكثر مما توقعنا. تمكنا من إجراء مقابلات مع 300 شخص ، من بينهم ليس فقط محللي المنتجات والتسويق و BI ، ولكن أيضًا مهندسي ML- ، DWH ، الأمر الذي كان ممتعًا بشكل خاص. في المجموعة الأكبر كان جميع أولئك الذين يطلقون على أنفسهم علماء البيانات - هذا هو 36 ٪ من المستجيبين. من الصعب القول ما إذا كان هذا يغطي طلب السوق أم لا ، لأن السوق نفسها يتم تشكيلها فقط.



توزيع مستويات العمل أمر محرج - هناك ما يقرب من عدد قادة الفريق والقادة كما هو الحال في dzhuns. قد يكون هناك عدة أسباب لذلك. على سبيل المثال ، عدد كبير من الفرق الصغيرة من 2-3 أشخاص ، حيث يمكن أن يكون الرأس متخصصًا في المستوى المتوسط ​​أو العالي.



قد يكون هناك سبب آخر هو الفوضى السائدة في السوق من حيث المعايير في توزيع الأدوار والوظائف. يتم تعيين Timlids أحيانًا من قبل أولئك الذين يعملون ببساطة لمدة عام أو عامين أطول من غيرهم ، دون الرجوع إلى مستوى المهارات والمعرفة. نرى هذا أيضًا في توزيع الوظائف حسب الموقع - 38 ٪ من المديرين وقادة الفرق منخرطون في المعالجة المسبقة و 33 ٪ آخرون يشاركون في التحليل الإحصائي الأساسي.





طلبنا هنا من المستجيبين إجراء تقييم ذاتي لمستوى التحليلات في شركاتهم. إذا نظرت عن كثب ، يمكنك أن ترى أن 10٪ من المستجيبين الذين يعملون في الأقسام التحليلية المكونة من 2-3 أشخاص يعتقدون أن لديهم "مستوى متقدم".

وما هو "المستوى المتقدم"؟ يعمل نظام BI بشكل جيد. هناك DWH والبيانات الكبيرة. يتم إجراء اختبارات A / B بانتظام. هناك أنظمة ML و DS عاملة في الإنتاج. يتم اتخاذ القرارات فقط وفقا للبيانات. يعد قسم العمل مع البيانات وعلوم البيانات أحد العناصر الأساسية في الشركة.

يكاد يكون من المستحيل تحقيق كل ما سبق مع قسم من 2-3 أشخاص. أعتقد أن نتيجة المسح هذه هي مرض نمو صغير - لا يوجد لدى الرجال من يقارنون أنفسهم من أجل تحديد مستواهم بموضوعية أكثر.





من المتوقع أن معظم المتخصصين في البيانات لا يقضون معظم الوقت في الرياضيات أو الهندسة المعقدة للغاية ، ولكن على المعالجة المسبقة للبيانات وتحميلها وتنظيفها. في كل تخصص ، نرى المعالجة المسبقة في أعلى 3. لكن الأشياء المعقدة مثل تطوير نماذج ML أو العمل مع Big Data نادرة للغاية في أعلى 3 - فقط بين مهندسي ML و DWH.



هناك بضع رؤى حزينة. 40٪ من المهام التي حددها الخبراء لأنفسهم. في كازاخستان ، حتى الآن لم تختبر سوى أفضل شركات يونيكورن فوائد العمل باستخدام البيانات الضخمة وتعلمت كيفية القيام بذلك بكفاءة. يبثون إلى السوق أن البيانات الكبيرة والتعلم الآلي رائعان ، والمستوى الثاني يتبع ، لكنهم لا يفهمون دائمًا كيفية ترتيب العمل مع البيانات. لذلك ، نرى أن الخبراء يحددون المهام لأنفسهم ، وأن العمل لا يعرف دائمًا ما يريده.



لقد فوجئت بأن 20 ٪ من المتخصصين لا يعرفون على الإطلاق ما إذا كانت شركتهم لديها مستودع بيانات. نعم ، ومع أنظمة إدارة قواعد البيانات ، ليس كل شيء على ما يرام - 41٪ يستخدمون MySQL ، و 34٪ يستخدمون PostgreSQL. عن ماذا يتحدث؟ يعملون أكثر مع البيانات الصغيرة.



في السؤال عن أنظمة التخزين ، نرى مرة أخرى MySQL وحتى (!) Excel. ولكن قد يشير هذا ، على سبيل المثال ، إلى أن معظم الشركات ببساطة ليس لديها حتى الآن طلب للعمل مع البيانات الضخمة.



كل شيء هنا غامض مرة أخرى. بشكل عام ، كانت الرواتب أقل بقليل مما كنت أتوقع.



أنا شخصياً ، من الصعب بالنسبة لي أن أتخيل مهندس ML مستعد للعمل من أجل 200 ألف تنغي - ربما هذا متدرب. إما أن كفاءات هؤلاء المتخصصين ضعيفة للغاية ، أو أنه لا يزال من الصعب على الشركات تقييم عمل علم البيانات بشكل مناسب. ولكن ربما يشير هذا أيضًا إلى أن السوق لا يزال في بداية نموه. وبمرور الوقت ، سيتم تحديد مستوى الرواتب بمستوى أكثر ملاءمة.

Source: https://habr.com/ru/post/undefined/


All Articles