"Ya, mereka ada!" Apa yang dilakukan spesialis Ilmu Data di Kazakhstan dan berapa banyak yang mereka hasilkan?

Dmitry Kazakov , Ketua Tim Analisis Data di Kolesa Group, berbagi wawasan dari survei ahli data Kazakhstan yang pertama.


Dalam foto: Dmitry Kazakov

Ingat ungkapan populer bahwa Big Data paling mirip dengan seks remaja - semua orang membicarakannya, tetapi tidak ada yang tahu apakah itu benar. Hal yang sama dapat dikatakan tentang pasar spesialis data (di Kazakhstan) - ada hype, tetapi siapa yang ada di belakangnya ( dan apakah ada orang sama sekali ), tidak sepenuhnya jelas - baik untuk eychars, maupun manajer , atau data para ilmuwan itu sendiri.

Kami melakukan penelitian di mana kami mewawancarai lebih dari 300 spesialis tentang gaji, fungsi, keterampilan, peralatan, dan banyak lagi lainnya.

Spoiler:Ya, mereka pasti ada, tetapi semuanya tidak begitu sederhana.

Wawasan yang bagus. Pertama, ada lebih banyak spesialis data dari yang kami harapkan. Kami berhasil mewawancarai 300 orang, di antaranya tidak hanya analis produk, pemasaran, dan BI, tetapi juga insinyur MLH, insinyur DWH, yang sangat menyenangkan. Dalam kelompok terbesar adalah mereka yang menyebut diri mereka ilmuwan data - ini adalah 36% responden. Sulit untuk mengatakan apakah ini menutupi permintaan pasar atau tidak, karena pasar itu sendiri hanya terbentuk.



Distribusi tingkat pekerjaan memalukan - ada hampir sebanyak pemimpin tim dan pemimpin sebanyak ada dzhun. Mungkin ada beberapa alasan untuk ini. Misalnya, sejumlah besar tim kecil yang terdiri dari 2-3 orang, di mana kepala dapat menjadi spesialis di tingkat menengah atau senior.



Alasan lain mungkin kekacauan yang berlaku di pasar dalam hal standar dalam distribusi peran dan fungsionalitas. Timlids kadang-kadang ditunjuk oleh mereka yang hanya bekerja selama satu atau dua tahun lebih lama daripada yang lain, tanpa mengacu pada tingkat keterampilan dan pengetahuan. Kami melihat ini juga dalam distribusi fungsi berdasarkan posisi - 38% manajer dan pemimpin tim terlibat dalam pra-pemrosesan dan 33% lainnya terlibat dalam analisis statistik dasar.





Di sini kami meminta responden untuk secara subjektif menilai tingkat analitik di perusahaan mereka. Jika Anda perhatikan dengan seksama, Anda dapat melihat bahwa 10% responden yang bekerja di departemen analitik yang terdiri dari 2-3 orang berpikir bahwa mereka memiliki "tingkat lanjutan".

Dan apa yang dimaksud dengan "tingkat lanjutan"? Sistem BI berfungsi dengan baik. Ada DWH dan Big Data. Tes A / B dilakukan secara teratur. Ada sistem ML dan DS yang berfungsi dalam produksi. Keputusan dibuat hanya berdasarkan data. Departemen pekerjaan dengan data dan Ilmu Data adalah salah satu kunci dalam perusahaan.

Semua hal di atas hampir mustahil untuk mencapai departemen 2-3 orang. Saya percaya bahwa hasil survei semacam itu adalah penyakit pertumbuhan kecil - orang-orang tidak memiliki siapa pun untuk membandingkan diri mereka sendiri untuk menentukan tingkat mereka lebih objektif.





Diharapkan bahwa sebagian besar waktu spesialis data tidak dihabiskan untuk matematika atau teknik super kompleks, tetapi pada preprocessing, mengunggah, dan membersihkan data. Dalam setiap spesialisasi, kita melihat preprocessing di 3 teratas. Tetapi hal-hal kompleks seperti mengembangkan model ML atau bekerja dengan Big Data sangat jarang di 3 besar - hanya di antara para insinyur ML dan DWH.



Ada beberapa wawasan yang menyedihkan. 40% dari tugas yang ditetapkan oleh para ahli. Di Kazakhstan, sejauh ini hanya perusahaan unicorn teratas yang menguji manfaat bekerja dengan data besar dan belajar bagaimana melakukannya dengan kompeten. Mereka menyiarkan ke pasar bahwa Big Data dan Pembelajaran Mesin keren, dan tingkat kedua mengikuti, tetapi jauh dari selalu memahami bagaimana pekerjaan dengan data diatur. Oleh karena itu, kami melihat bahwa para ahli mengatur tugas untuk diri mereka sendiri, dan bisnis tidak selalu tahu apa yang diinginkannya.



Saya terkejut bahwa 20% spesialis tidak tahu sama sekali apakah perusahaan mereka memiliki Gudang Data. Ya, dan dengan sistem manajemen basis data, tidak semuanya baik - 41% menggunakan MySQL, dan 34% lainnya menggunakan PostgreSQL. Apa yang bisa dibicarakan? Mereka bekerja lebih banyak dengan data kecil.



Dalam pertanyaan tentang sistem penyimpanan, kita kembali melihat MySQL dan bahkan (!) Excel. Tetapi ini dapat menunjukkan, misalnya, bahwa sebagian besar perusahaan belum memiliki permintaan untuk bekerja dengan data besar.



Semuanya di sini lagi ambigu. Secara umum, gaji sedikit lebih rendah dari yang saya harapkan.



Secara pribadi, sulit bagi saya untuk membayangkan seorang insinyur ML yang siap bekerja untuk 200 ribu tenge - mungkin ini magang. Entah kompetensi spesialis seperti itu sangat lemah, atau masih sulit bagi perusahaan untuk mengevaluasi pekerjaan Ilmu Data secara memadai. Tapi mungkin ini juga menunjukkan bahwa pasar masih di awal pertumbuhannya. Dan seiring waktu, tingkat gaji akan ditetapkan pada tingkat yang lebih memadai.

Source: https://habr.com/ru/post/undefined/


All Articles