Yandex.Practicum - Analis Data. Wisuda

Artikel pertama ada di sini.

Pelatihan di Yandex.Practicum telah berakhir, sertifikat telah diterima dan Anda dapat meringkas pelatihan.


Juga, setelah artikel pertama, banyak yang memiliki pertanyaan tambahan, jadi saya ingin menjawabnya dan menunjukkan sedikit latihan. Kasus telah dikuasai cukup banyak, jadi dalam kerangka satu artikel, semuanya tidak dapat dibahas.

Pertama-tama, saya ingin menggambarkan apa yang terjadi dalam pelatihan setelah menulis artikel pertama. Apa yang ingin saya gambarkan secara terpisah.

Pertama,


Kursus "Otomasi" ternyata menjadi yang paling sulit bagi saya secara pribadi - pada otomatisasi proses analisis data (skrip, dasbor, dll.), Kualitas materi pelatihan ternyata sama sekali tidak relevan.

Ini murni kegagalan teknis dari kategori - “Saya, sesuatu yang diklik dan semuanya keluar” :)
(ketidakcocokan versi perangkat lunak, masalah dengan peralatan), menyebabkan pelanggaran tenggat waktu untuk pekerjaan. Ternyata saya tidak punya pengalaman dengan baris perintah, tetapi saya harus segera belajar ...


Sebagai bagian dari topik ini, kami memperoleh pengalaman bekerja pada mesin virtual di Yandex.Cloud :

, . , , , . , (CLI), API SDK.


-,


Saya terkesan dengan kursus dengan judul memikat "Prakiraan dan Prediksi" (pembelajaran mesin). Ternyata menjadi sangat penting, analis harus memiliki pemahaman tentang pembelajaran mesin, meskipun ini lebih relevan dengan Ilmu Data. Saya akan segera mengatakan bahwa saya menyukai gagasan untuk memperkenalkan kesimpulan analitik yang diperoleh segera dalam praktek, karena saya menyukai siklus kerja penuh dan semakin sedikit pemisahan proses, semakin baik hasilnya (namun, ada beberapa kesulitan dalam hal itu).

Kursus ini terdiri dari 3 blok besar:

  • tugas pembelajaran mesin dalam bisnis,
  • algoritma pembelajaran mesin,
  • proses pemecahan masalah pembelajaran mesin.

Ketiga,


Proyek kelulusan diadakan di Yandex.Tracker - tugas dan sistem manajemen proses sehingga siswa membenamkan diri dalam proses kerja, seperti di perusahaan nyata.


Setiap siswa melaksanakan proyeknya dan mengirim laporan ke Pelacak, tugas yang tidak terduga juga tiba. Itu adalah pengalaman yang menarik, tetapi sulit untuk mengevaluasi tenggat waktu waktu di perusahaan nyata (untuk berapa lama biasanya suatu proyek dilakukan dalam hidup).

Dan pekerjaan peer review terakhir di Peergrade adalah platform online untuk melakukan sesi umpan balik siswa. Di sana kami mengevaluasi salah satu tugas satu sama lain di proyek.

Keempat,


sangat menyukai program penempatan kerja. Anda bisa menjadi spesialis yang baik, tetapi tidak mengerti sama sekali apa yang perlu dilakukan untuk menampilkan diri Anda dengan benar dan memadai. Tampak bagi saya bahwa memiliki portofolio di tangan, dengan pekerjaan yang selesai, majikan akan melihat segalanya, kami akan berbicara, dan prosesnya akan dipersingkat untuk semua orang, tetapi ternyata tidak ada yang melihat proyek. Dalam kebanyakan kasus, semuanya dimulai dengan departemen SDM dan oleh karena itu Anda harus memiliki resume dan surat pengantar yang normal, dan banyak seluk-beluk lainnya. Karena itu, tanpa diduga bagi saya, program ini sangat berguna.

temuan


Anda akan menjadi spesialis siap pakai di pintu keluar jika Anda memiliki pengalaman di bidang tertentu di mana Anda tidak hanya dapat menerapkan alat yang telah Anda pelajari, tetapi juga dapat menginterpretasikan hasilnya, dan idealnya, juga menerapkannya.

Yandex.Practicum hanya akan memberi Anda alat untuk analisis, dan Anda benar-benar dapat mempelajari alat dari awal (misalnya, setelah lulus dari sekolah), tetapi tidak mungkin menafsirkan hasilnya, karena ini ada pendidikan khusus atau pengalaman di bidang tertentu.


Di negara kami, Workshop sedikit lebih cepat dari jadwal, karena ternyata untuk begitu banyak lowongan Anda akan membutuhkan Excel dengan sempurna :). Tampaknya, pengusaha mengalami kesulitan untuk pindah ke alat data lainnya.

Biarkan saya mengingatkan Anda bahwa aliran kami adalah yang pertama, dan saya mengerti bahwa akan ada kesulitan teknis dan pengembang kursus juga akan belajar sampai batas tertentu dari kami.

Kerugian utama bagi saya adalah "faktor manusia". Kemudian, menganalisis proyek saya yang sudah selesai, saya menemukan beberapa kesalahan yang seharusnya ditunjukkan oleh guru kepada saya. Dan secara umum, dirasakan bahwa para guru tidak memiliki cukup waktu untuk memeriksa, saya menghubungkan semua ini dengan produk baru dan kami sepenuhnya menyelesaikan masalah ini. Selain itu, orang-orang yang melakukan kursus berusaha sangat keras untuk membuat produk super, misalnya, topik "Prakiraan dan Prediksi" telah sepenuhnya diperbarui dan telah menjadi jauh lebih mudah dimengerti dan lengkap. Saya alami lagi.

Ada juga kontradiksi dalam rekomendasi tentang penerapan metode tertentu dari guru yang berbeda, sudut pandang yang berbeda.

Alat belajar


( apa yang lebih baik untuk memiliki ide sebelum memulai kelas untuk menghemat waktu, terutama jika Anda bekerja secara paralel ):

  • Python , lebih baik jika Anda memiliki gagasan bahasa sebelum memulai kelas. Ada kursus pengantar, tetapi kursus pengantar lainnya juga tidak ada salahnya;
  • Notebook Jupyter , juga lebih baik dibaca sebelum kelas;
  • SQL diperlukan hampir di mana-mana, semua yang Anda butuhkan untuk memulai sudah pasti diberikan, sekarang ini adalah soal praktik;
  • analisis statistik , saya sangat menyarankan Anda memulai " Dasar-dasar Statistik " di Stepik dengan Anatoly Karpov sebelum memulai ,


    , « » . « » « . 2 3.» .

:

  • - ( , , -, );
  • , (/-);
  • , (, , );
  • ( , , , , , );
  • pembelajaran mesin, sklearn (pra-pemrosesan, pembuatan model, klasifikasi, memilih model terbaik), tetapi tetap saja ini merupakan kursus yang agak singkat, dan mereka yang ingin bekerja di bidang ini akan memerlukan kursus yang lebih maju, misalnya dari Yandex

Dan juga, jika itu sudah lama sekali atau Anda tidak tahu apa-apa tentang teori probabilitas sama sekali, lihat setidaknya pelajaran dari GetAClass pertama pada kombinatorik , kemudian pada teori probabilitas .

Tak perlu dikatakan bahasa Inggris.

Di bagian kedua artikel, saya akan menunjukkan aplikasi praktis dari pengetahuan yang diperoleh untuk analisis penelitian: kampanye iklan di Yandex.Direct, kunjungan ke situs, dan identifikasi kemungkinan penipuan. Pada data yang dikumpulkan lebih dari 6,5 tahun.

All Articles