كيف لا تنضم إلى صفوف المتخصصين الطموحين إذا كنت عالم بيانات


أجرى مجتمع هبرة مقابلة أخرى في مشروعنا التعليمي: البث المباشر مع رجال من قسم تكنولوجيا المعلومات يجيبون على أسئلتك بتنسيق اتصال مباشر.

مشروعنا هو محاولة لإنشاء مجموعة كاملة من الأدلة والتوصيات لحياة المطور الناجحة: كيفية بناء مهنة ، والحصول على عرض الحلم ، وجذب الاستثمار في الشركات الناشئة ، وعدم الخروج في مشاريع مملة ، والنمو في عملك وشراء منزل عن طريق البحر في طريقك.

في بداية الأسبوع ، أجاب بوريس يانجيل ، مهندس Yandex ML الذي شارك في إنشاء أدمغة أليس ويقوم الآن بصنع مركبات بدون طيار ، على أسئلتنا. 

تحدث بوريا عن كيفية أن يصبح عالمًا بارزًا في عالم البيانات ، وكيف يساعده القفز بالمظلات في عمله ، ولماذا تكون مؤتمرات ML غير مجدية ، وأجاب على منشور حديث . أب غاضب حول كيف أوصت أليس فيديو لقصص القتل لطفل.



اسمي بوريس يانجيل ، أعمل في ياندكس. أنا مهندس ML حسب المهنة ، ومؤخرا كنت أدير مشاريع ML. في الوقت الحالي أعمل في مشروع Yandex للمركبات غير المأهولة ، لتطوير جزء من مكدس ML. في السابق ، كان منخرطًا في Alice ، وكان مسؤولًا عن تطوير الوحدة ، والتي يمكن تسميتها بشروط "أدمغتها" - هذه الوحدة ، بعد التعرف على الكلام ، تحدد ما أراد المستخدم قوله ويقرر الإجابة. قبل ذلك ، عملت في مجموعة تكنولوجيا الشبكة العصبية Yandex ، وقبل ذلك ، في Microsoft Research ، في مجموعة Chris Bishop ، في مشروع Infer.net ، هذه مكتبة إخراج بايزي. حتى في وقت سابق ، كنت مسؤولاً عن ترتيب البحث في الصور في Yandex.

, ? , machine learning ?


السؤال غريب بعض الشيء. سوف أعيد صياغة: ما هو الحد الأدنى من المهارات التقنية المطلوبة (اعتمادًا على ما تريد القيام به) ، هل يمكن للشخص الحاصل على تعليم ليبرالي أن يتلقاها؟

إذا كان "تسجيل الدخول" ، دعنا نقول ، تدريب شبكة عصبية ليس فقط لتمييز الكلاب عن القطط ، ولكن للقيام بما تحتاجه شخصيًا ، فهناك طريقة يمكن الوصول إليها من قبل العديد من الأشخاص. هناك الكثير من التعليمات البرمجية على الإنترنت لحل المشاكل الشائعة ، والآن يمكنك بسهولة وسرعة أخذ هذا الرمز ، وإدخال بياناتك فيه والحصول على النتيجة. هذا هو أبسط شيء يمكن القيام به ، ومهارات ذلك تتطلب الحد الأدنى ، بما في ذلك البرمجة.

ما عليك سوى القدرة على فهم الرمز النهائي وتحريره. إذا كانت الشفرة منظمة بشكل جيد ، فهي سهلة.

إذا قمت بتسجيل الدخول - فهذا يعني أن تقوم بعمل شبكة عصبية بنفسك لحل مهمة أقل صعوبة ، تصبح المهمة أكثر تعقيدًا ، وهناك حاجة إلى المزيد من المهارات.

من أجل جمع الشبكات العصبية بنفسك ، تحتاج على الأقل إلى فهم بسيط للرياضيات ، ومعرفة أساسيات الجبر الخطي ، وفهم ما هي المصفوفات ، والمتجهات ، والموترات ، وما يمكنك القيام به معهم ، وما هو المشتق والتدرج. لا أستطيع أن أقول إن الخبير فقط هو الذي سيكتشف الأمر ، لكنك تحتاج إلى المعرفة ، بما في ذلك الأجزاء التي تتكون منها الشبكات العصبية وكيف من المعتاد إرساءها للحصول على النتيجة.

الآن هناك أطر سهلة الاستخدام إلى حد ما لتوصيل عناصر الشبكات العصبية - على سبيل المثال ، TensorFlow مع وظيفة Keras الإضافية (إنها بسيطة للغاية ، فأنت تحتاج إلى الحد الأدنى من معرفة Python). لكن Keras قد لا تكون كافية للعمليات غير التافهة ، وبعد ذلك سيكون عليك العمل مع TensorFlow "العاري" - وهذا يتطلب المزيد من المهارات ، خاصة لإنشاء عملياتك الخاصة داخل TensorFlow. كلما أردت المضي قدمًا ، زادت المهارات التي ستحتاجها. علاوة على ذلك ، تبدأ المشاكل بالضبط عندما يحدث خطأ ما: من أجل معرفة سبب عدم عمل النظام بالطريقة التي تحتاجها ، تحتاج إلى مستوى أعلى نسبيًا من المهارات - تحتاج إلى أن تكون على دراية كاملة بما يحدث "تحت غطاء محرك السيارة. "

ما نوع الكتب المتعلقة بعلوم البيانات والتعلم الآلي في Python التي يحتاجها المبتدئون؟ كيف تمارس هذه المعرفة؟


لست متأكدا من أنني أستطيع الإجابة على هذا السؤال بشكل صحيح. عندما كنت مبتدئًا ، كان عدد الكتب الجيدة أقل بكثير من الآن ، وكان العثور على المعلومات الصحيحة في شكل مناسب أكثر صعوبة.

الآن هناك العديد من الكتب حول التعلم العميق ، على سبيل المثال ، كتاب Goodfellow - هناك معظم الأساسيات التي تحتاج إلى معرفتها على الشبكات العصبية والرياضيات اللازمة. هناك كتب ذات نهج عملي - فهي لا توفر الإلمام بالطرق الرياضية فحسب ، بل تخبرك أيضًا على الفور بكيفية القيام بشيء محدد في Python.

هناك كتاب لمؤلف Keras ، فرانسوا شول ، حول التعلم العميق مع Keras. هناك العديد من الكتب ، على الرغم من أنني لا أستطيع أن أقول أيهما أفضل. يبدو لي أنه يمكنك أخذ كتب بأمان عن المؤلفين المشهورين.

إذا كانت المهمة هي تكوين العمود الفقري للمعرفة ، فستكون هناك حاجة إلى المزيد من الكتب الأساسية ، على سبيل المثال ، التعرف على الأنماط والتعلم الآلي لكريس بيشوب ، أوصي بقراءتها والقيام بالتمارين من خلالها. ليس من الضروري أن تقرأ بالكامل ، لكن الفصول الرئيسية - على سبيل المثال ، حول نظرية الاحتمالية - ستساعد على بناء فهم لكيفية تشكيل التعلم الآلي بالكامل لإطار واحد.

بالإضافة إلى ذلك ، من المهم معرفة كيفية التفكير في النماذج . نحن لا نستخدم طرقًا معينة فقط للحصول على النتيجة ، ولكننا نمثل البيانات. نحن بحاجة إلى تبني طريقة التفكير هذه - على سبيل المثال ، سيساعد كتاب كريس بيشوب الإلكتروني للتعلم الآلي القائم على النموذج في ذلك .مجاني جزئيًا. كل فصل من هذا الكتاب هو مثال لمهمة تحتاج إلى بناء نموذج لها ، وخلال الفصل ، تحاول باستمرار القيام بذلك ، مما يعقد النموذج تدريجيًا ، حتى تحصل على النتيجة. وهذا يساعد على اعتماد طريقة التفكير اللازمة لعلم البيانات.

بالنسبة للممارسة - لقد تحدثت بالفعل عن مدى أهمية معرفة ما يحدث "تحت غطاء المحرك". للقيام بذلك ، من الأفضل محاولة جمع شيء بنفسك. اكتب منحدرًا متدرجًا بنفسك بدلاً من استخدام إطار جاهز ، أو اكتب طبقة وأضفها إلى الإطار. حاول التوصل إلى مهمة غير تافهة نسبيًا ببنية مثيرة للاهتمام. حلها في سياق تحديد المعرفة والمعلومات التي تفتقر إليها. تعقيد الحل باستمرار لتحسين الجودة. دعها تكون مثل هذه المهمة ، والتي ستكون نتيجة الحل لها فائدة لك شخصياً.

الآن هناك تطور سريع لـ TensorFlow JS. أنا أتعلم التعلم الآلي وأريد استخدام هذه المكتبة. ما هي احتمالات الواجهة الأمامية؟


يمكن استخدام TensorFlow JS في الواجهة الأمامية كنقطة دخول للتعلم الآلي ، على الرغم من أنني لا أفهم تمامًا السبب. إذا كان هذا لأنك تعرف جافا سكريبت فقط ، فهذا هو الدافع الخاطئ ؛ بايثون سهلة التعلم.

يحتوي TensorFlow JS على مجال التطبيق الخاص به: هذا هو التعلم الآلي ، حيث يعمل الاستدلال مباشرة في المتصفح ، مما يسمح لك بإنشاء أدوات تعلم عميقة تفاعلية. يسمح لك بإعطاء الشخص أداة تفاعلية يمكنك من خلالها العمل مع الخوارزميات والنماذج ، وإنشاء تصورات وبالتالي تحسين فهمك للموضوع. ربما تكون هناك مجالات واعدة أخرى للتعلم العميق حيث تحتاج إلى تفاعلية - على سبيل المثال ، أدوات للإبداع ، حيث يمكنك العمل مع الصور في الوقت الحقيقي أو تجميع الموسيقى.

كيف تصبح متخصصًا رائعًا في أي مجال من مجالات الذكاء الاصطناعي (على سبيل المثال ، البرمجة اللغوية العصبية) ، في أسرع وقت ممكن؟


بالنسبة للجزء الثاني ، تعتمد السرعة دائمًا على قاعدة المعرفة الموجودة.

بالنسبة للجزء الأول - يبدو لي أن السؤال المطروح بشكل غير صحيح هنا. كانت البرمجة اللغوية العصبية تمتلك الكثير من التقنيات المختلفة ، وكنت بحاجة إلى معرفة الكثير لحل المشكلات ، ولكن بعد ذلك جاء متخصصو التعلم العميق هناك. لقد توصلوا إلى BERT بتحسينات تدريجية ، والآن لحل مهام NLP ، لا تحتاج إلى معرفة أي شيء باستثناء BERT. في نفس الوقت ، من أجل فهم BERT ، لا تحتاج إلى فهم البرمجة اللغوية العصبية - تحتاج إلى معرفة كيفية تطبيق النماذج على الرموز المميزة. تحتاج إلى أن تصبح متخصصًا في التعلم الآلي ، وبعد ذلك ستكون متاحًا - بجهد قليل - مجالات التطبيق المختلفة.

كيف تصبح متخصصًا في التعلم الآلي الرائع؟


بادئ ذي بدء ، تحتاج إلى بناء في ذهنك إطارًا مفاهيميًا جيدًا لما يحدث في التعلم الآلي. طالما أنك تدرك أنها مجموعة من الحقائق والخوارزميات والاستدلال المتباينة ، فلن تذهب بعيدًا.

بشكل تقريبي ، يجب على المرء أن يفهم ما يلي: كل ما نقوم به هو البحث عن وظائف من مجموعة من أفضل ما في المعنى. تحتاج إلى فهم ما هي المعاني التي تكون فيها الوظيفة هي الأفضل ، من بين المجموعات التي يمكنك البحث فيها عن الوظائف ، ولماذا نفضل مجموعة أو مجموعات أخرى ، ولماذا يكون البحث أكثر فعالية في بعضها عن غيرها ، ما هي الحيل الموجودة للبحث في مجموعات مختلفة. عليك أن تفهم أن هذه الوظائف هي نماذج بيانات (على الأقل تلك التي تهمنا).

يتم بناء نماذج البيانات باستخدام تقنيات قياسية من مجموعة صغيرة ، والتي هي نفسها تقريبًا للتعلم العميق والبرمجة الاحتمالية ؛ أنت بحاجة إلى فهم كيفية الجمع بين هذه التقنيات ، وفي أي الحالات. ثم ستجد أنك تفهم كيفية حل المهام في مجالات مواضيع مختلفة.

لنفترض أن هناك مرشحات Kalman - نمذجة ديناميكيات الأنظمة في الوقت المناسب ، وهناك كتب عنها يمكن قراءتها. إذا كان فلتر كالمان لا يناسبك ، فلن تتمكن من إجراء أي تعديلات عليه للقيام بشيء مماثل لمهمتك ، ولكن "ليس مرشح كالمان تمامًا".

ولكن إذا فهمت أن هذا مجرد نموذج احتمالي مبني على مبادئ معينة وبسيطة إلى حد ما (حيثما يكون هناك شيء غير معروف ، أضف توزيعًا طبيعيًا ، وكل شيء تم تصميمه بشكل مباشر هو ديناميات خطية) ، فيمكنك بناء شيء ما تحتاجه حتى دون معرفة مرشحات كالمان.

إذا حققت طريقة التفكير هذه ، فستجد أن معظم المقالات - حتى من أهم المؤتمرات - غير مثيرة للاهتمام. عادة ، يتم وصف التحسينات الإضافية هناك باستخدام تقنيات قياسية يمكنك تطبيقها بنفسك - وسيكون هذا واضحًا لك - وبدون إمكانية التوسع خارج حدود مجموعة البيانات المستخدمة. على أي حال ، لن تفوتك مقالات جيدة يتم فيها تقديم تقنيات جديدة حقًا - سيتحدث الجميع عنها ، وسوف تتعلم عنها بسرعة. اتضح أن هناك عددًا قليلًا من المقالات المطلوبة حقًا.

أخبرنا عن المكدس الذي تعمل معه. ما المكتبات والأطر التي يجب أن يدرسها اختصاصي التعلم الآلي المبتدئ؟


أعمل بشكل رئيسي مع TensorFlow و Keras. لا يزال PyTorch يكتسب شعبية - يمدحه الزملاء.

عندما يأتي Keras - أي ، يمكن استخدام تلك التجريدات عالية المستوى الموجودة فيه ، وليس هناك حاجة للتعمق - من الأفضل استخدام Keras ، إنه يوفر الوقت. بالطبع ، تحتاج إلى فهم كيفية عمل Keras وكيفية تجاوزها إذا لزم الأمر.

إذا كان هناك شيء مفقود في Keras نفسها ، فيمكنك دائمًا إضافة قطعة إلى TensorFlow - تسمح الهندسة بذلك.

كيف يتم إنشاء Yandex الطيار الآلي على مراحل؟ ما نوع المتخصصين المعينين لهذا ، كيف يتم بناء سير عمل علوم البيانات / التعلم الآلي؟


أولاً ، سأصف بإيجاز كيفية عمل المكدس "بدون طيار" - لمزيد من التفاصيل ، راجع تقرير فيديو أنطون سليساريف ، من السهل العثور عليه. يحتوي المكدس على العديد من المكونات. الإدراك هو رؤية لما يحدث حول الآلة في الوقت الحالي. 

التوطين هو فهم مكان السيارة ، باستخدام المعلومات من أجهزة الاستشعار والخرائط المعدة مسبقًا.

التنبؤ هو التنبؤ بما سيحدث في الثواني التالية (أي كيف سيتصرف المشاركون الآخرون في الحركة) بمساعدة المعرفة حول كيفية بناء العالم الآن وكيف تم بناؤه في الماضي ؛ أنا أعمل فقط في هذا الجزء.

التخطيط- ما يأتي بعد الإدراك والتنبؤ: أنت بحاجة إلى اختيار تسلسل آمن من الإجراءات التي تؤدي إلى حل المشكلة. 

التحكم - تحويل هذا التسلسل إلى تعليمات للسيارة (عجلة القيادة ، فرامل الغاز).

تتطلب العديد من عناصر هذا المكدس ML الآن ، أو لا يتم استخدامها في الحلول الحديثة. هناك الكثير من أعمال هندسة ML - من الضروري القيام بهذا العمل والعمل بسرعة ، لأن الكمون في مثل هذه الأنظمة أمر بالغ الأهمية. نحن بحاجة إلى معرفة كيفية تدريب النماذج ، لفهم المقاييس التي تسمح لنا بفهم ما أصبح أفضل ، وأي منها لا يسمح لنا ، لفهم كيفية جمع البيانات بشكل أكثر كفاءة. بالإضافة إلى ذلك ، هناك عنصر ضخم من أعمال البنية التحتية ، غالبًا ما يتم التقليل من قيمته. هناك حاجة إلى بنية تحتية قوية للغاية لتطوير جميع هذه المكونات معًا.

تجمع الطائرات بدون طيار كمية كبيرة من البيانات حول كل ما يحدث لها - تحتاج إلى أن تكون قادرًا على العمل بسرعة مع هذه البيانات ، والإجابة على أسئلة مثل "ما الذي سيحدث في الوضع X إذا كان هناك تغيير في Y في الرمز". وهذا يتطلب حلولاً هندسية غير تافهة ومهندسين جيدين.

سير عمل علم البيانات / التعلم الآلي ، كما هو الحال في أي مكان آخر ، في رأيي. يجب أن يكون لدى أي فريق مقياس يجب تحسينه في الوقت الحالي.

بالنسبة لمعظم الأشخاص ، يمر يوم نموذجي بحثًا عما يجب فعله لتحسين هذا المقياس. ويجب أن يتماشى هذا المقياس مع هدفك - بالطبع ، من الصعب التوصل إليه على الفور ، سيتطور المقياس تدريجيًا.

لنفترض أنك صنفت مصنفًا للمشاة. وجد المشاة حولها ، باستخدام متوسط ​​الدقة ، دعنا نقول. يمكنك تحسين المقياس وتجد أنه يبدو أنه ينمو من تغييراتك ، ولكنه في الواقع يزداد سوءًا. أنت تدرك أن المقياس سيئ. توصل إلى استنتاج مفاده أنه ليس من الضروري البحث عن جميع المشاة - أولئك الذين يتقدمون كثيرًا ، أو خلفهم على بعد 50 مترًا ، لا يؤثرون علينا بأي شكل. نحتاج إلى توضيح المقياس. تذهب فقط لأولئك المشاة القريبين. ثم تفهم أن هذا سيئ أيضًا: فأنت مهتم فقط بالمتقدمين.

هذه هي الطريقة التي يحدث بها تطور المقياس. في كل لحظة ، يتم إصلاح مقياس معين ، وتقوم بتحسينه. هذا يريحك من العبء المعرفي: أنت تفكر فقط في كيفية تحسين رقم واحد - ويعمل جزء من الفريق باستمرار على الاختيار الأمثل للرقم الذي يحتاج إلى تحسين.

أنا منغمس في موضوع "الذكاء الاصطناعي القوي". لدي سؤالان: لماذا لا يمكننا تعلم الذكاء الاصطناعي بالطريقة التي نعلم بها أطفالنا ، وما مجال الاستخدام الذي سيخلق الأول ذكاء اصطناعيًا قويًا ، على الإطلاق؟


أفهم السؤال الأول على النحو التالي: يبدو الأمر كما لو أن الأطفال يتم تعليمهم من البسيط إلى المعقد. في البداية ، يعيشون في نموذج مبسط للعالم ، حيث يوجد سانتا كلوز ، لكن عالمهم يصبح تدريجياً أكثر تعقيدًا ، ويتعلم الأطفال حل المشكلات الأكثر تعقيدًا. يبدو من المنطقي أن يتم تدريس الذكاء الاصطناعي وفقًا لمبدأ مماثل - حتى أن هناك مثل هذا الاقتراح من توماس مكلوف (وهو الآن على Facebook AI Research) لبناء مخطط تدريب للذكاء الاصطناعي القوي.

بالإضافة إلى ذلك ، في التعلم الآلي ، هناك مجال لتعلم المناهج - أي التدريب النموذجي على مبدأ "من البسيط إلى المعقد". المشكلة هي أن كل شيء يعمل الآن في نفس المهمة. نفس المهمة للعثور على الكلاب - في البداية يتم تعليم الشبكة لتمييز الكلاب عن القطط في الصور حيث لا تبدو على الإطلاق ، ثم تأخذ المزيد والمزيد من الكلاب المماثلة. هذه طريقة تكرارية - تكرارية: من المفترض أن الشبكة ستبني مفاهيم بسيطة ، ثم ، على أساسها ، مفاهيم أكثر تعقيدًا. لا يعمل عندما يتعلق الأمر بمفاهيم مختلفة.

إذا بدأت بتعليم النظام شيئًا ، بعد أن قمت بتدريسه لآخر ، فإنه ينسى تلك المفاهيم التي تم تذكرها سابقًا. هذه مشكلة النسيان الكارثي ؛ لم يقم أحد بحلها بعد. يغير نزول التدرج جميع الأوزان دفعة واحدة ، وهذا يدمر المفاهيم القديمة. نحن بحاجة إلى معرفة كيفية بناء مفاهيم جديدة دون تدمير المفاهيم القديمة.

ترتبط مجالات البحث التعلم بلقطة واحدة والتعلم بلقطة واحدة بهذا: مفاهيم التعلم لمهمة واحدة واستخدامها لحل مشكلة أخرى مع عدد قليل من الأمثلة. لم تكن هناك اختراقات أساسية في هذا المجال ، ولكن يجب القيام بها من أجل الحصول على فكرة عن الذكاء الاصطناعي القوي.

لا أرى أي سبب لعدم ظهور ذكاء اصطناعي قوي في المستقبل. من وجهة نظرنا الحديثة ، الدماغ البشري هو آلة تقوم بإجراء الحسابات ، وإن كان ذلك وفقًا لمبادئ أخرى.

لا توجد عقبات أساسية أمام إنشاء ذكاء اصطناعي قوي ، ولكن لا يمكنني إعطاء تقدير لمقدار الوقت المتبقي حتى هذه اللحظة - من غير المعروف ما هي الخطوات الأخرى المطلوبة لهذا الغرض. إذا استنبطنا ، باستخدام سرعة التقدم في التغلب على "البقع البيضاء" في الماضي ، يمكننا استدعاء شخصية مثل "من 10 إلى 50 عامًا" - لكنها لا تزال "إصبع إلى السماء". يمكنك الطعن في قانون مور وحساب متى يكون لدى المعالجات كثافة ترانزستور كافية لتحقيق القدرة الحسابية للدماغ - أيضًا لعدة عقود ، وسيكون هذا أيضًا "إصبعًا إلى السماء".

لا أعتقد أن الذكاء الاصطناعي القوي - إذا تم اختراعه - سيأتي من العمل. بدلاً من ذلك ، سيتم إنشاؤه من قبل شخص يشارك ، بموارد كبيرة ، في البحث الأساسي في التعلم المعزز: من جميع مجالات التعلم الآلي ، هذا هو الأقرب إلى ما نريده من الذكاء الاصطناعي القوي. في حالة وجود DeepMind أو OpenAI لعدة عقود أخرى - فربما تكون موجودة. أو شخص سيأتي في مكانهم.

ما هي أفضل هندسة تستخدم لتصنيف السلاسل الزمنية (وليس التنبؤ بها ، ولكن تصنيفها)؟ LSTM أو أي شيء آخر؟


في السنوات الأخيرة ، لوحظ هذا الاتجاه: في كل مكان تقريبًا كان LSTM مفيدًا ، كان الاهتمام يعمل بشكل أفضل. لقد حدثت ثورة البرمجة اللغوية العصبية للتو: لقد استبدلنا الشبكات المتكررة باهتمام ، وتحسنت. بالنسبة للسلسلة الزمنية ، أنصحك بتجربة الانتباه أيضًا. كل هذا يتوقف على المهمة ، ولكن ، بشكل عام ، هذه هي الطريقة الأكثر فعالية لتحليل التسلسلات وجمع البيانات عنها.

تشارك في التعلم الآلي ، ليس فقط للعمل ، ولكن أيضًا كهواية باهظة الثمن. أنا أقوم ببناء شبكة ، وقد تم إدخالها في بطاقات 3 غيغابايت ، أكثر تعقيدًا بعض الشيء - لقد ولت. هل هناك أي بدائل إلى جانب وحدة المعالجة المركزية؟


يمثل نقص الأموال المخصصة للحديد ، والتي يمكنك من خلالها إظهار نتائج في البحث الحديث عن التعلم العميق ، مشكلة للمتحمسين ، وحتى للجامعات.

تمتلك Google مبادرة Google Collab: إنها مثل IPython في مرافق Google ، حيث يمكنك الحصول على طاقة بطاقة الفيديو المتطورة لمدة 12 أو 24 ساعة ، وكذلك تشغيل شيء ما على TPU. لا يستخدم المستهلكون بطاقات الفيديو ، ولديهم المزيد من الذاكرة - هناك 130 غيغابايت ، كما يبدو لي. يسلمها يطلق العنان. ولكن ، بشكل عام ، أشياء كبيرة حقًا لا يستطيع المستخدم الفرد تحملها.

تحاول بعض الشركات إنشاء شرائح مخصصة خصيصًا للتعلم العميق ، مما سيجعل الحسابات للشبكات العصبية أسرع وأرخص بكثير من وحدات معالجة الرسومات - ربما تظهر حلول المستهلكين مع هذه الرقائق في السنوات القادمة.

لماذا تتوقع سلوك المشاركين الآخرين في الحركة عند تطوير طائرة بدون طيار؟


على الطريق من الضروري. عند اتخاذ قرار ، من الضروري أن تأخذ في الاعتبار ، في جملة أمور ، القصور الذاتي للآلة: من المستحيل تغيير الاتجاه على الفور (حتى لو كان ذلك ممكنًا ، يجب أن يكون الراكب سيئًا). نحن بحاجة إلى تخطيط الإجراءات بحيث لا يكون هناك شخص آخر في المكان الذي نود أن نكون فيه في بضع ثوانٍ - لهذا نحتاج إلى توقع موقف ونوايا المشاركين الآخرين. يجب أن يعمل مسار الماكينة إلى أقصى حد ممكن من المشاركين الآخرين - وهذا ضروري لركوب آمن.

كيف تدور عجلة قيادة طائرة بدون طيار؟


أنا لا أتحكم بنفسي. أستطيع أن أقول أن هناك سيارات مختلفة - يمكن للبعض فقط إعطاء أوامر لقيادة عجلة القيادة. في رأيي ، يمكن لل بريوس.

ماذا تستخدم - سكروم ، كانبان ، الفوضى؟


نظمت الفوضى.

لا أرى حاجة إلى تنظيم سير العمل بشكل صارم ، وخاصة البحث: من الصعب تحديد المدة التي ستستغرقها مهمة معينة. لدينا قدر كبير من عدم اليقين ، وليس من الواضح لي سبب إدخال هيكل إضافي.

نحاول التواصل كثيرًا ، نحاول تسجيل جميع نتائج التجارب ؛ لدينا أنظمة خاصة تقوم بتخزين بيانات التجربة بغض النظر عن حجمها - أي نوع من الكود المستخدم ، ومن أي فرع تم تجميعه ، وما هي البيانات التي تم إطلاقها - بغرض إعادة إنتاجها بالكامل. نقوم بتسجيل كل الاستنتاجات ومناقشتها فيما بيننا ، وتبادل المعلومات ، ومحاولة جعل كل شيء مفتوحًا وشفافًا قدر الإمكان.

هل هناك أي خبرة في استخدام ML في الصناعة - المعادن والتعدين والتخصيب؟


أعلم أنه في هذه المجالات يتم استخدام اللغة الإنجليزية بشكل نشط ، ولكن لا توجد تجربة شخصية.

ظهر مقال مؤلم مؤخرًا حول أليس توصي بتسجيل فيديو حول قصة قتل لطفل. لماذا يحدث هذا ، هل يصعب تصفية المحتوى؟


إن مهمة تصفية المحتوى ، من حيث المبدأ ، قابلة للحل وبدقة عالية. ما حدث بالضبط في هذه الحالة ، لا أعرف بالتأكيد ، ولكن يمكنني التفكير.

لنفترض أن النظام يحتوي على محتوى تابع ، وأن هناك واجهة برمجة تطبيقات حيث يجب على الشركاء وضع علامة على هذا المحتوى باستخدام العلامات أو بطرق أخرى. يعمل النظام في البداية على الثقة في الشركاء - من الممكن أنه من وقت لآخر سيكون هناك فحص للمحتوى. بمرور الوقت ، لن يكون هذا كافيًا ، ستقوم بتعليق نظام محتوى بسيط مع البحث عن كلمات التوقف في العناوين والعلامات ، وعرض جزء على الأقل من المحتوى من قبل المشرفين.

في كل نظام ، سيكون هناك حتمًا نقطة فشل: أحيانًا يرتكب الناس أخطاء ، وأحيانًا لا يفي الشركاء بالتزاماتهم. كل ما يمكن فعله هو إجراء المزيد من التكرارات وتحسين النظام ، وعادة ما تكون التحسينات تفاعلية: إذا كان هناك شيء يعمل بشكل جيد بما فيه الكفاية ، فلن تكون هناك تحسينات عادة حتى تصبح ضرورية.

ربما عندما يظهر ذكاء اصطناعي قوي ، يمكنك أن تطلب منه تصفية كل المحتوى بدقة 100٪.

هل تحضر مؤتمرات دولية حول أنظمة معالجة المعلومات العصبية والتعلم الآلي؟ ما هي انطباعاتك عن المؤتمرات الروسية في هذا المجال؟


لا استطيع ان اقول عن الروس. أذهب إلى الدولية أحيانًا ، لكنني أفهم أقل وأقل لماذا.

إن "السياحة العلمية" مهمة ومثيرة للاهتمام بالطبع ، ولكن يبدو أن المؤتمرات نفسها قد توقفت عن أداء وظيفتها. يتم قبول عدد كبير من المقالات عليها ، ولكن بسبب ذلك ، من المستحيل تنظيم عرض عادي لكل مؤلف. على سبيل المثال ، في ICML فقط أفضل ورقة لها تقارير طويلة ، وجميع البقية لديها تقارير أضواء ، أقل من خمس دقائق.

علاوة على ذلك ، هناك عدد كبير من الأعمال - التدريجية ، مع استنساخ مشكوك فيه ، وفائدة منها للمستمعين - لا. إذا كان المؤتمر يحتوي على عمل رائع حقًا ، فستكون على دراية به بالفعل ، على الأرجح - يتم التخطيط المسبق في وقت مبكر.

أعتقد أن شكل المؤتمر يجب أن يعاد اختراعه - أو على الأقل رفع بشكل كبير ما يجب اتخاذه.

ما هو دافعك للعودة إلى روسيا؟


غادرت روسيا لأنه كان من الممتع بالنسبة لي العيش في أماكن جديدة والتعلم من أشخاص جدد. بدا لي أنه من أجل التنمية الشخصية ، تحتاج إلى الوصول إلى حيث يعرف الناس أكثر مني. في الواقع ، هذا ما حدث: في Microsoft Research ، فهمت كثيرًا حول مدى المنهجية التي يجب أن تكون عليها ، ومدى عمق وجودة فهم ما تفعله ، وكم يجب أن تكون على دراية بما يحدث. حسنًا ، في مرحلة ما شعرت بالملل ، على الرغم من وجود مهام مثيرة للاهتمام.

ثم عشت في كامبريدج - هذه مدينة صغيرة يحدث فيها القليل ، ولا يمكن مقارنة الدائرة الاجتماعية فيها بموسكو. فكرت: الآن يمكنك العيش في موسكو ، وتطبيق المعرفة المكتسبة ، ثم ، ربما ، الذهاب إلى مكان آخر. ذهبت للعمل في Yandex - يبدو أنها جيدة جدًا في تطبيق ما تعلمته.

يبدو لي أنهم الآن في DeepMind و OpenAI يقومون بأشياء مثيرة للاهتمام ، يمكنني أن أتعلم الكثير هناك.

سمعت أن فريق الطائرات بدون طيار يفضل استخدام TensorFlow بدلاً من PyTorch لتدريب نماذج الاستدلال. ما سبب ذلك؟


ربما لأسباب تاريخية. لا أستطيع أن أقول لماذا TensorFlow أفضل أو أسوأ من PyTorch.

ما الحجم الذي يجب أن تكون عليه مجموعة البيانات؟ هل 50-60 ألف مثال تدريبي كاف ، أم أن الملايين مطلوبة؟


يعتمد على النموذج المستخدم والمهمة. يجب أن تكون مجموعة البيانات مثل تكوين معلمات النموذج ومنع إعادة التدريب. إذا كان لديك نموذج خطي تافه ، فيمكن أن تكون مجموعة البيانات صغيرة. إذا كانت هذه شبكة عصبية معقدة ، فإن 60 ألفًا لا تكفي.

إن تعلم الشبكات العصبية المعقدة من الأشياء غير التافهة من الصفر يتطلب دائمًا تقريبًا عشرات أو مئات الملايين. لم يزول مبدأ "المزيد من البيانات - المزيد من الجودة".

بالمناسبة ، حول مسألة كيف تصبح خبيرًا في البرمجة اللغوية العصبية. يعمل التعلم العميق المتطور الآن على الدوام مع البيانات الضخمة. يجب أن تتم معالجتها مسبقًا ، ثم يتم تدفقها بشكل فعال إلى العقد الحسابية التي توفر التدريب.

يمكننا أن نقول أن التعلم العميق هو عمل قرد صغير: لتحقيق النجاح ، عليك تجربة الكثير من الأشياء ، وعدم التأكد من نتيجة العمل مع بعضها البعض.

ربما يمكنك تطوير حدس للخيارات التي ستعمل على الأرجح ، على الرغم من أنني لم أقابل شخصًا بحدس دقيق. في الحالة العامة ، سيكون أكثر الفرق نجاحًا هو الفريق الذي يمكنه إجراء معظم التجارب لكل وحدة زمنية.

معظم عملي هو إزالة "الاختناقات" في عملية التعلم في محاولة "لتفريقها" إلى السرعة الممكنة نظريًا. هذا يتطلب مهارات هندسية ، والقدرة على الضغط على الأداء خارج الكود والأجهزة.

ما يميز الخبير عن عالم البيانات العادي هو أن الخبير عادة ما يكون أيضًا مهندسًا جيدًا ، وقادرًا على العمل بسرعة ، وكتابة التعليمات البرمجية ، والتعامل مع أنظمة تخزين ومعالجة البيانات الموزعة ، وفهم بنية أجهزة الكمبيوتر والشبكات - من أجل حساب "الكمامات". من المهم جدًا تطوير هذه المهارات بنفسك.

مع هيمنة البيانات الضخمة ، فإن أولئك الذين يعرفون كيفية الحصول على تدريب للعمل بسرعة على هذه الكميات من البيانات هم الأكثر نجاحًا في الصناعة. إذا نجح التعلم العميق في أحجام صغيرة ، أود أن أقول إن المعرفة به فقط مطلوبة ، ولكنها الآن ليست كذلك.

تعلم البرمجة بشكل جيد ، وتعلم خوارزميات علوم الكمبيوتر القياسية ، وزد آفاقك. بالمناسبة ، التشفير مفيد.

هل تستخدم نظائر AutoML لضبط العمارة والمعلمات ، أو المزيد من التجارب والحدس اليدوي؟


الآن - أكثر من الثانية. الضبط التلقائي موجود على مستوى الاجتياح عن طريق الشبكة أو تحسين بايزي ، وهو أمر أكثر تعقيدًا في AutoML لم يتم بعد. يتطلب الكثير من موارد الحوسبة - إذا كانت محدودة ، فمن الأفضل الاعتماد على الحدس. ولكن ، إذا فهمت أنك قد وصلت إلى بعض الكلمات العشوائية ، فمن الأفضل أن تعهد بها للعملية.

ماذا تفعل أليس ، وما الذي لا يفعله مساعد Google؟ ما هو حجم الفريق في هذا الاتجاه لجوجل وياندكس؟


لا يمكنني التحدث عن ياندكس. يبدو أن لدى Google مئات أو آلاف الأشخاص. بالنسبة إلى مزايا Alice ، لست متأكدًا من أنني لم أتبع إما تطوير منتجات Alice أو ميزات المساعد مؤخرًا.

يبدو لي أن مسألة الجودة غير صحيحة. حتى لو كانت أليس أسوأ ، فهل هذا يعني أنها لا تملك الحق في الوجود؟ يتم إنشاء المنتجات والتنافس مع بعضها البعض ، ونتيجة لذلك فإنها تفوز وتتطور وتمتد.

لا أفهم عقلية "المنتج الجديد هو نفس منتج Google". في الأعمال التجارية ، يتم إنشاء المنتجات بهذه الطريقة: تأخذ فكرة شخص آخر كأساس ، وتنفذها - أحيانًا كما هي بشكل عام - ولكن هذه ليست نقطة النهاية في المسار ، ولكن البداية. ثم تقوم بتغيير الفكرة تدريجيًا بحيث تصبح أفضل من تلك الخاصة بالمنافس. هذه هي قصة التقدم الكاملة!

كيف تساعد الرياضة على تحقيق المزيد في المجالات الأخرى؟


في الرياضة ، وخاصة المنافسة ، أحب الغموض. إذا خسرت ، فستخسر. لا يمكنك إلقاء اللوم على الظروف: لم تكن جيدًا بما فيه الكفاية ، لقد فعلت شيئًا خاطئًا.

في الرياضات التنافسية ، يتطور الصراحة والإخلاص والقدرة على الاعتراف بالأخطاء. إنه يساعد في مجالات أخرى - من الأفضل دائمًا الاعتراف بأنك بحاجة إلى أن تصبح أفضل في X و Y و Z من البحث عن الأعذار. إلى جانب الفوائد الصحية بالطبع.

كيف يساعدك القفز بالمظلات على الخروج من منطقة راحتك؟


تخيل أنك تريد القفز من الطائرة بواسطة مجموعة من الأشخاص ووضع شيء معًا. تدخل الطائرة الطائرة المقاتلة ، ويفتح الباب ، وتصطف جميعًا في الداخل وتنتظر الإشارة لتقفز معًا.

في هذه اللحظة ، يجب ألا يكون هناك شك في ما يحدث. تأخير حتى جزء من الثانية يؤخر الجميع. يجب أن تدخل نفسك في حالة تقفز فيها دون تردد. يختفي العالم ، وتبقى قفزة فقط. إذا حدث شيء ما مع المظلة ، فلن يكون لديك الكثير من الوقت لاتخاذ إجراء - عندها يجب ألا يكون هناك شك وخوف ، فأنت بحاجة إلى أن تفعل ما تعلمته بالضبط ، في أسرع وقت ممكن.

يغذي القفز بالمظلة في شخص القدرة على اتخاذ قرار للقيام بشيء ما - وعدم الشك أكثر. يمكن رسم مواز بين هذا والمشاريع المعقدة. في بعض الأحيان يكون من غير الواضح ما يجب فعله في المشروع ؛ عندما تبدأ المهمة ، فأنت لا تعرف بالضبط ما يجب القيام به ، وكيفية القيام به ، وما إذا كان يمكن القيام به على الإطلاق. في هذه اللحظة ، من السهل أن تبدأ بالشك والتفكير ، "ماذا لو لم أستطع؟" - يتم إنفاق الوقت والجهد العقلي على ذلك. إذا طُلب منك حل مشكلة ، فإنهم يؤمنون بك. يجب عليك بذل كل جهد ممكن لهذه المشكلة. أنت بحاجة إلى جلب نفسك إلى الحالة العقلية نفسها كما في القفز ، لإسقاط كل شيء غير ضروري والتركيز. أصبح من الأسهل بالنسبة لي تحقيق ذلك بعد أن بدأت الانخراط في القفز بالمظلات.

كم تنفق على القفز بالمظلات؟


كثيرا من. هذه مقالة مهمة في ميزانيتي. أنا أعتبر هذا حافزًا للنمو الوظيفي الإضافي.

ما النادي الذي أنت فيه؟


بشكل رئيسي في Pushchino ، هناك بعض التخصصات المتقدمة جيدًا هناك - على سبيل المثال ، بشكل حر.

إلى أين أذهب للدراسة كمهندس ML؟


بياناتي قديمة بالفعل ، لقد درست لفترة طويلة - في جامعة موسكو الحكومية ، في VMK. لا أستطيع أن أقول أنه كان تعليمًا فائق الامتياز ، لكن المعلمين علمونا جيدًا وقدموا لنا عالم ML. أعتقد أن الكثير من الناس يعرفون ديمتري بتروفيتش فيتوف - أنا مدين له بالكثير ، إن لم يكن لمحاضراته والدورة الخاصة التي جلبتني إليها ، ربما لم أكن لأدرس ML. لا أعرف أين يدرس الآن ، ولكن من المؤكد أنه يستحق الذهاب إلى هناك. بالإضافة إلى ذلك ، بغض النظر عن الكلية التي تدرس بها ، أوصي بالذهاب إلى SHAD إن أمكن. ليس لأنه Yandex ، ولكن لأنه مكان رائع حقًا - هناك سيقدمون كل المعرفة اللازمة للعمل العملي الجيد في الصناعة ، والتي قد لا تكون في الجامعة. من شاد ، يأتي إلينا العديد من الأشخاص المدربين والموهوبين الذين يعرفون ماذا يفعلون.

مرة أخرى حول مسألة ما إذا كان من الممكن الدخول في ML "ليس فنيًا". هناك حاجة إلى المهارات التقنية ، لكن تخصص الفنون الحرة ليس مانعًا. لفهم أساسيات البرمجة والرياضيات ، ما عليك سوى التفكير في أكتافك والقدرة على التفكير المنطقي والهيكلي. هناك العديد من الأشخاص الذين ، على الرغم من أنهم اختاروا لسبب ما تخصصًا إنسانيًا ، يمتلكون هذه المهارات. لا شيء مستحيل ، الشيء الرئيسي هو المحاولة. من الضروري عدم التفكير في موضوع "هل يمكنني" ، ولكن للبدء في فعل ذلك؟ وهذا يزيد بشكل كبير من فرص النجاح.

هل من الممكن أن تدرس في مدرسة للتعلم في نفس الوقت مع الجامعة؟


فعلت ذلك ، على الرغم من أنه كان صعبًا للغاية. هناك حمولة كبيرة في SHAD. يمكنك الجمع بين SHAD وأحدث دورات الجامعة ، حيث يكون الحمل صغيرًا نسبيًا - سيكون العمل شاقًا ، ولكنه سيؤتي ثماره.

تجربة سباق السيارات مع الطائرات بدون طيار؟


لدينا رياضيون نشطون في قيادة السيارات ، لأننا بحاجة إلى تدريب السائقين ومهندسي ضمان الجودة الموجودين في السيارة مباشرة. يجب أن يكونوا قادرين على التعرف على حالة الطوارئ أثناء الاختبارات والاستجابة ، ويخضعون جميعًا لتدريب في حالات الطوارئ من قبل رياضيي السيارات. إذا كنا نتحدث عما إذا كنا نستخدم نوعًا من نماذج فيزياء الإطارات التي يستخدمها الرياضيون المحترفون في محاكاة سباقات السيارات لتطوير التكتيكات - في رأيي ، لا ، لن نقطع مئات أجزاء الثانية على الدائرة بعد. يختلف القياس عن بُعد ، وهو مفيد للرياضيين ، عما نحتاجه ، ولدينا المزيد من البيانات المقاسة.

ماذا بعد؟


سيتم البث المباشر التالي يوم الاثنين المقبل.
يمكنك طرح سؤال على Natalya Teplukhina - عضو فريق Vue.js الأساسي و GoogleDevExpret ومهندس الواجهة الأمامية في GitLab.

يمكنك أسألها سؤال في تعليق على هذا . آخر

تفسير مقابلة مع إيلونا، مهندس البرمجيات في الفيسبوك، ويمكن أن تقرأ هنا. Insiderings من موظف الفيسبوك: كيفية الحصول على التدريب، والحصول على العرض وكل شيء عن العمل في شركة


All Articles