كيف تتعلم من عالم البيانات: المهارات التقنية المطلوبة

ما هي المعرفة التقنية التي أصبحت أكثر شعبية لدى أصحاب العمل ، والتي تفقد شعبيتها.

صورة

في مقالتي الأصلية في عام 2018 ، نظرت في الطلب على المهارات المشتركة - الإحصائيات والتواصل. نظرت أيضًا إلى الطلب على Python ولغة برمجة R. تتغير تقنية البرمجيات بشكل أسرع بكثير من الطلب على المهارات العامة ، لذلك فأنا أدرج التكنولوجيا فقط في هذا التحليل المحدث.

لقد بحثت عن الكلمات الرئيسية التي ظهرت في قوائم الوظائف لـ Data Scientist في الولايات المتحدة على مواقع مثل SimplyHired و الواقع و Monster و LinkedIn. هذه المرة قررت كتابة رمز لفحص جميع القوائم بدلاً من البحث يدويًا. كان هذا القرار ناجحًا للغاية لـ SimplyHired ، والواقع ، و Monster. كنت تطلب و حساء جميل من مكتبة بيثون HTTP. يمكنك رؤية الرمز مع التحليل في تقريري على GitHub .

اتضح أن تجاوز LinkedIn هو أكثر صعوبة. يجب أن تمر بعملية التفويض لعرض العدد الدقيق لقوائم الوظائف. قررت استخدام السيلينيوم لعرض الصفحات بدون واجهة مستخدم رسومية. في سبتمبر 2019 ، المحكمة العليا الأمريكيةفاز بالقضية ضد LinkedIn ، مما يسمح لك بمسح بيانات الموقع. ومع ذلك ، لم أتمكن من الوصول إلى حسابي بعد عدة محاولات تسجيل دخول. ربما نشأت هذه المشكلة بسبب حدود السرعة. تحديث: ما زلت قادرًا على تسجيل الدخول ، ولكن أخشى أن يمنعوني عندما أحاول مرة أخرى.

بالمناسبة ، تمتلك Microsoft LinkedIn ، وتمتلك Randstad Holding Monster ، وتمتلك Recruit Holdings بالفعل و SimplyHired.

على أي حال ، لم توفر بيانات LinkedIn مقارنة دقيقة للعام السابق مع الحاضر. لاحظت هذا الصيف تقلبات كبيرة عند البحث عن وظائف في المجال التقني. أفترض أنهم ربما جربوا خوارزمية بحث باستخدام معالجة اللغة الطبيعية. على العكس ، فقد ظهر نفس العدد تقريبًا من الوظائف الشاغرة لـ "عالم البيانات" على مواقع أخرى على مدار العامين الماضيين.

هذا هو السبب في أنني استبعدت نتائج LinkedIn 2019 و 2018 من هذه المقالة.

لكل موقع بحث عن وظيفة ، قمت بحساب النسبة المئوية لإجمالي عدد إعلانات الوظائف لعلماء البيانات حيث ظهرت الكلمة الرئيسية. ثم قمت بمتوسط ​​هذه النسب المئوية عبر ثلاثة مواقع لكل كلمة رئيسية.

لقد استكشفت يدويًا عمليات البحث الجديدة وراجعت أكثرها واعدة. لم يصل أي من الطلبات الجديدة إلى متوسط ​​5 ٪ في قائمة عام 2019 ؛ أدناه سترى نتيجة التحديد.

اذهب!

النتائج


توجد أربع طرق على الأقل لعرض نتائج كل كلمة رئيسية:

  1. قسّم عدد إعلانات الكلمات الرئيسية على إجمالي عدد طلبات البحث التي تتضمن "عالم بيانات" في كل موقع بحث عن وظيفة لكل رمز. ثم تأخذ متوسط ​​المواقع الثلاثة. هذه العملية التي وصفتها سابقًا.
  2. 2018 2019 .
  3. 2018 2019 .
  4. . .

دعونا نلقي نظرة على الخيارات الثلاثة الأولى باستخدام الرسوم البيانية. ثم سأعرض لك جدولًا بالبيانات ، وسنناقش النتائج.

لذلك ، هنا مخطط مع الفقرة الأولى لعام 2019. يمكننا أن نرى أن Python يظهر في 75٪ تقريبًا من الإعلانات.

صورة

يوجد أدناه مخطط للفقرة الثانية ، يوضح الإضافات والنقصان من حيث متوسط ​​النسبة المئوية للإعلانات بين 2018 و 2019. نمت AWS 5 ٪ من النقاط. في المتوسط ​​، ظهرت في عام 2018 في 14.6٪ من الإعلانات ، بينما نمت في 2019 إلى 19.4٪.

صورة

هنا رسم بياني للفقرة الثالثة ، يظهر النسبة المئوية للتغير من سنة إلى أخرى. نمت PyTorch بنسبة 108.1٪ مقارنةً بمتوسط ​​النسبة المئوية للإعلانات التي ظهرت فيها عام 2018.

صورة

تم تجميع جميع الرسوم البيانية في بلوتلي. إذا كنت تريد معرفة كيفية استخدام Plotly لإنشاء تصورات تفاعلية ، فراجع دليلي. إذا كنت تريد إلقاء نظرة على الرسوم البيانية التفاعلية ، فانتقل إلى ملف HTML في تقريري على GitHub. كود مع التحليل والتصور في نفس المكان.

أدناه في شكل جداول المعلومات من الرسوم البيانية أعلاه ، مرتبة حسب النسبة المئوية للتغير في متوسط ​​النسبة المئوية للإعلانات من 2018 إلى 2019.

صورة

أفهم أن هذا كله مربك بعض الشيء ، لذا هنا دليل صغير للمعلومات الواردة في الجدول.

  • 2018 Avg هو متوسط ​​النسبة المئوية للإعلانات منذ 10 أكتوبر 2018 من SimplyHired ، والواقع ، و Monster.
  • 2019 Avg هو نفس 2018 Avg ، فقط هذا هو 4 ديسمبر 2019. يتم عرض هذه البيانات في الرسم البياني الأول من المخططات الثلاثة أعلاه.
  • التغيير في المتوسط ​​هو عمود 2019 مطروحًا منه 2018. هذه المعلومات مأخوذة من الجزء الثاني من المخططات الثلاثة أعلاه.
  • النسبة المئوية للتغيير هي النسبة المئوية للتغيير من 2018 إلى 2019. هذه البيانات على الرسم البياني الثالث.
  • ترتيب عام 2018 هو ترتيب نسبة إلى الكلمات الرئيسية الأخرى في عام 2018.
  • ترتيب عام 2019 هو ترتيب نسبي لكلمات رئيسية أخرى في عام 2019.
  • تغيير الترتيب هو زيادة أو نقصان في التصنيف خلال هذين العامين.

ماذا نتعلم من هذه المعلومات؟


حدثت تغييرات كبيرة في أقل من 14 شهرا.

الفائزون


بيثون لا يزال على ظهور الخيل. هذه هي الكلمة الرئيسية الأكثر شيوعًا. حرفيا في ثلاثة من أربعة إعلانات. نمت Python بشكل لائق منذ 2018.

SQL هي نجمنا الصاعد. تجاوز تقريبا R في ثاني أكبر متوسط. بهذه الوتيرة ، سيأتي قريبًا في المركز الثاني.

وقد ظهر أكبر نمو من خلال أطر التعلم العميق .

في PyTorch كانت أكبر الكلمات الرئيسية المكاسب. Keras و TensorFlowكما أظهر النجاح. صعد كل من Keras و PyTorch أربع درجات ، TensorFlow - ثلاث. يرجى ملاحظة أن PyTorch بدأ بمتوسط ​​منخفض ، ولا يزال متوسط ​​TensorFlow مرتفعاً مثل PyTorch. أصبحت

مهارات النظام الأساسي السحابي أكثر شيوعًا. ظهرت AWS في ما يقرب من 20 ٪ من الإعلانات ، و Azure في حوالي 10 ٪ وتسلق أربع خطوات.

هذه هي التقنيات الأكثر تقدما.

الخاسرون


نحن R أكبر انخفاض في متوسط ​​القيمة. هذا الاكتشاف ليس مفاجئًا للغاية ، نظرًا لنتائج الدراسات الأخرى . Python متقدم على R كلغة برمجة. مع ذلك ، لا تزال R تحظى بشعبية كبيرة ، حيث تظهر في 55 ٪ من الإعلانات. لا تيأس إذا كنت تمتلك R ، ولكن فكر أيضًا في تعلم Python إذا كنت ترغب في الحصول على مهارة مطلوبة أكثر.

العديد من منتجات Apache ، بما في ذلك Pig و Hive و Hadoop و Sparkتفقد شعبيتها. انخفض Pig خمسة مناصب في الترتيب - أكثر بكثير مقارنة بأي تقنية أخرى. لا يزال هناك طلب مرتفع على Spark و Hadoop ، ولكن استنادًا إلى نتائجي ، يمكنك رؤية الاتجاه نحو تقنيات Big-Data. فقدت

حزم البرامج الإحصائية MATLAB و SAS إلى حد كبير في شعبيتها. انخفض MATLAB أربعة أسطر في الترتيب ، بينما انخفض SAS من المركز السادس إلى الثامن. تظهر كلتا اللغتين انخفاضًا كبيرًا في النسبة المئوية مقارنة بمتوسط ​​2018.

تلميح


هناك الكثير من التقنيات في هذه القائمة. بالطبع ، لا تحتاج إلى معرفة كل شيء. لا عجب أن عالم البيانات الأسطوري يسمى وحيد القرن.

نصيحتي هي ما يلي - إذا كنت تبدأ في العمل في هذا المجال ، ركز على التقنيات المطلوبة.

تركيز.
على ال.
دراسة عربي.
واحد.
التقنيات.
خلف.
زمن.

(هذه نصيحة ممتازة ، على الرغم من أنني نفسي لم ألتزم بها دائمًا).

وبهذا الترتيب ، أوصي بدراسة:

  1. تعلم بايثون للبرمجة العامة.
  2. Pandas. , , data scientist Python Pandas Scikit-learn. Scikit-learn , Pandas . Pandas Matplotlib NumPy.
  3. Scikit-learn. «Introduction to Machine Leaning with Python».
  4. SQL .
  5. Tableau . , .
  6. . AWS – - . Microsoft Azure – . , Google Cloud, . , Google Cloud, , Data Engineer Google Cloud.
  7. . TensorFlow. «Deep Learning with Python» Keras . Keras TensorFlow, . PyTorch . , .

هذه هي نصائح التعلم العامة الخاصة بي. قم بتكييفها مع أهدافك أو المطرقة وافعل ما تريد.



صورة
تعرف على تفاصيل كيفية الحصول على مهنة مرغوبة من الصفر أو المستوى الأعلى في المهارات والراتب من خلال الحصول على دورات SkillFactory عبر الإنترنت:



اقرأ أكثر



All Articles