Yandex.Practicum - محلل بيانات. تخرج

المقال الأول هنا.

انتهى التدريب في Yandex.Practicum ، وتم استلام شهادة ويمكنك تلخيص التدريب.


أيضًا ، بعد المقالة الأولى ، كان لدى العديد من الأسئلة الإضافية ، لذلك أردت الإجابة عليها وإظهار القليل من الممارسة. لقد تم إتقان القضايا كثيرًا ، لذلك في إطار مقال واحد ، لن يعمل على تغطية كل شيء.

بادئ ذي بدء ، أريد أن أصف ما حدث في التدريب بعد كتابة المقال الأول. ما أود أن أصفه بشكل منفصل.

أولا،


تبين أن دورة "الأتمتة" كانت أصعب بالنسبة لي شخصيًا - فيما يتعلق بأتمتة عمليات تحليل البيانات (النصوص ، ولوحات المعلومات ، وما إلى ذلك) ، تبين أن جودة المواد التدريبية غير ذات صلة تمامًا.

كانت هذه إخفاقات فنية بحتة من الفئة - "ضغطت على شيء وخرج كل شيء" :)
(عدم توافق إصدارات البرامج ، مشاكل في المعدات) ، تسبب في انتهاك المواعيد النهائية للعمل. اتضح أيضًا أنه لم يكن لدي أي خبرة عمليًا في سطر الأوامر ، ولكن كان علي أن أتعلم بشكل عاجل ...


كجزء من هذا الموضوع ، اكتسبنا خبرة في العمل على جهاز افتراضي في Yandex.Cloud :

, . , , , . , (CLI), API SDK.


-,


لقد تأثرت بالدورة بعنوان مغرية "التوقعات والتنبؤات" (التعلم الآلي). اتضح أنه مهم جدًا ، يجب أن يكون المحلل لديه فهم لتعلم الآلة ، على الرغم من أن هذا أكثر صلة بعلوم البيانات. سأقول على الفور أنني أحببت فكرة تقديم الاستنتاجات التحليلية التي تم الحصول عليها على الفور في الممارسة ، لأنني أحب دورة العمل الكاملة وكلما قل فصل العمليات ، كانت النتيجة أفضل (ومع ذلك ، هناك بعض الصعوبات في ذلك).

تتكون الدورة من 3 كتل كبيرة:

  • مهام التعلم الآلي في الأعمال ،
  • خوارزميات التعلم الآلي ،
  • عملية حل مشاكل التعلم الآلي.

ثالثا،


تم عقد مشروع التخرج في Yandex.Tracker - نظام إدارة المهام والعمليات بحيث ينغمس الطلاب في عملية العمل ، كما هو الحال في شركة حقيقية.


قام كل طالب بتنفيذ مشروعه وأرسل تقارير إلى Tracker ، كما وصلت مهام غير متوقعة. لقد كانت تجربة مثيرة للاهتمام ، ولكن كان من الصعب تقييم الموعد النهائي في الشركات الحقيقية (إلى متى يتم تنفيذ المشروع عادةً في الحياة).

ووظيفة مراجعة النظراء الأخيرة في Peergrade هي منصة عبر الإنترنت لإجراء جلسات ملاحظات الطلاب. قمنا بتقييم إحدى مهام بعضنا البعض في المشروع.

الرابع ،


أحب برنامج التوظيف. يمكنك أن تكون متخصصًا جيدًا ، ولكن لا تفهم على الإطلاق ما يجب القيام به من أجل تقديم نفسك بشكل صحيح وكاف. بدا لي أن وجود المحفظة في متناول اليد ، مع الانتهاء من العمل ، سينظر صاحب العمل في كل شيء ، سنتحدث ، وسيتم تقصير العملية للجميع ، ولكن اتضح أنه لا أحد ينظر إلى المشاريع. في معظم الحالات ، يبدأ كل شيء بقسم الموارد البشرية ، وبالتالي يجب أن يكون لديك سيرة ذاتية عادية وخطاب تغطية ، والعديد من التفاصيل الدقيقة الأخرى. لذلك ، بشكل غير متوقع بالنسبة لي ، كان هذا البرنامج مفيدًا للغاية.

الموجودات


ستكون متخصصًا جاهزًا عند الخروج إذا كانت لديك خبرة في مجال معين حيث لا يمكنك فقط تطبيق الأدوات التي تعلمتها ، ولكن أيضًا ستكون قادرًا على تفسير النتيجة ، ومن الأفضل أيضًا تنفيذها.

سوف يمنحك Yandex.Practicum أدوات فقط للتحليل ، ويمكنك بالفعل تعلم الأدوات من الصفر (على سبيل المثال ، بعد التخرج من المدرسة) ، ولكن من غير المحتمل أن تفسر النتيجة ، لأن هناك تعليمًا متخصصًا أو خبرة عمل في مجال معين.


في بلدنا ، تكون ورشة العمل متقدمة قليلاً عن الموعد المحدد ، حيث اتضح أنه بالنسبة للعديد من الوظائف الشاغرة ستحتاج إلى Excel تمامًا :). يبدو أن أصحاب العمل يواجهون صعوبة في الانتقال إلى أدوات البيانات الأخرى.

دعني أذكرك بأن تدفقنا كان الأول ، وأدركت أنه ستكون هناك أي صعوبات فنية وسيتعلم مطورو الدورة إلى حد ما منا.

كان العيب الرئيسي بالنسبة لي هو "العامل البشري". في وقت لاحق ، من خلال تحليل مشاريعي المكتملة ، اكتشفت العديد من الأخطاء التي كان ينبغي على المعلمين الإشارة إليها. وبشكل عام ، كان هناك شعور بأن المدرسين لم يكن لديهم الوقت الكافي للتحقق ، وأنا أعزو كل هذا إلى منتج جديد ونحن نحل هذه المشكلة تمامًا. علاوة على ذلك ، يحاول الأشخاص الذين يقومون بالدورة بجد لصنع منتج فائق ، على سبيل المثال ، تم تحديث موضوع "التوقعات والتنبؤات" بالكامل وأصبح أكثر فهمًا واكتمالًا. أذهب من خلاله مرة أخرى.

كما كانت هناك تناقضات في التوصيات حول تطبيق أساليب معينة من المعلمين المختلفين ، وجهات نظر مختلفة.

أدوات التعلم


( ما هو الأفضل أن يكون لديك فكرة قبل بدء الفصول الدراسية لتوفير الوقت ، خاصة إذا كنت تعمل بالتوازي ):

  • Python ، من الأفضل إذا كانت لديك فكرة عن اللغة قبل بدء الدراسة. هناك دورة تمهيدية ، لكن الدورات التمهيدية الأخرى لن تضر أيضًا ؛
  • Jupyter Notebook ، من الأفضل أيضًا القراءة قبل الفصول الدراسية ؛
  • SQL مطلوب في كل مكان تقريبًا ، كل شيء تحتاجه للبدء تم إعطائه بالتأكيد ، الآن هو مسألة ممارسة ؛
  • التحليل الإحصائي ، أوصي بشدة أن تبدأ " أساسيات الإحصائيات " على Stepik مع أناتولي كاربوف قبل البدء ،


    , « » . « » « . 2 3.» .

:

  • - ( , , -, );
  • , (/-);
  • , (, , );
  • ( , , , , , );
  • التعلم الآلي ، sklearn (المعالجة المسبقة ، بناء النموذج ، التصنيف ، اختيار أفضل نموذج) ، ولكن لا تزال هذه دورة قصيرة إلى حد ما ، وسيحتاج أولئك الذين يرغبون في العمل في هذا المجال إلى دورة أكثر تقدمًا ، على سبيل المثال من Yandex

وأيضًا ، إذا كان ذلك منذ وقت طويل أو إذا كنت لا تعرف شيئًا عن نظرية الاحتمالات على الإطلاق ، انظر على الأقل إلى الدروس من GetAClass أولاً حول التوافقيات ، ثم عن نظرية الاحتمالات .

وغني عن القول الإنجليزية.

في الجزء الثاني من المقالة ، سأعرض التطبيق العملي للمعرفة المكتسبة لتحليل البحث: حملة إعلانية في Yandex.Direct ، وزيارات للموقع ، وتحديد احتيال محتمل. على البيانات التي تم جمعها على مدى 6.5 سنة.

All Articles