डीप लर्निंग पर उच्च तर्क

नमस्ते दोस्तों। आज की सामग्री बुनियादी और उन्नत पाठ्यक्रमों "डेटा साइंस के लिए गणित" में समूहों के अगले सेट के लॉन्च के लिए समर्पित है




आज हम गहन शिक्षण विधियों के बारे में कुछ विचारों पर ध्यान देंगे। हम वैज्ञानिक वातावरण में गहरी सीखने को लागू करने के लिए टेम्पलेट विधियों की समीक्षा के साथ शुरू करते हैं, और फिर हम एंड-टू-एंड डिजाइन प्रक्रिया के बारे में बात करेंगे, साथ ही वैकल्पिक मशीन सीखने के तरीकों की विशेषताओं के बारे में संक्षेप में बताएंगे जो विशिष्ट समस्याओं को हल करने के लिए अधिक आशाजनक हो सकते हैं।

साइंस डीप लर्निंग टेम्प्लेट


वैज्ञानिक समुदाय में आमतौर पर गहरी सीखने की विधियां कैसे उपयोग की जाती हैं? उच्च स्तर पर, आप कई टेम्पलेट तरीके तैयार कर सकते हैं, जिनके साथ निम्नलिखित कार्यों में गहन शिक्षण का उपयोग किया जा सकता है:

  1. भविष्यवाणियों. , – (). . , , , , . , « / ». – , , . , ( ) (, ), .
  2. . , , . . , . , , , . , . , .
  3. . , (, , , ), . , , , , .

Workflow


उपर्युक्त गहन शिक्षण अनुप्रयोग टेम्पलेट्स का उपयोग करते हुए, हम शुरू से अंत तक एक गहरी सीखने की प्रणाली को डिजाइन करने के वर्कफ़्लो को देखेंगे। में चित्रा 1, तुम क्या एक ठेठ गहरी सीखने कार्यप्रवाह दिखेगा देख सकते हैं।


चित्रा 1: एक विशिष्ट गहरी सीखने के वर्कफ़्लो का आरेख।

एक विशिष्ट गहन शिक्षण अनुप्रयोग विकास प्रक्रिया को तीन मुख्य चरणों से मिलकर देखा जा सकता है: (i) डेटा प्रोसेसिंग चरण, (ii) प्रशिक्षण घटक, (iii) सत्यापन और विश्लेषण। इन चरणों में से प्रत्येक में उनके साथ जुड़े कई चरण और तरीके शामिल हैं, जो आंकड़े में भी दिखाया गया है। इस समीक्षा में, हम अधिकांश प्रशिक्षण चरण विधियों, और कई सत्यापन और डेटा विश्लेषण तकनीकों को शामिल करेंगे। कृपया ध्यान दें कि जबकि प्राकृतिक अनुक्रम में पहले डेटा को संसाधित करना, फिर प्रशिक्षण, और अंततः सत्यापन शामिल है, मानक विकास प्रक्रिया में चरणों के कई पुनरावृत्तियों की संभावना है, अर्थात, किसी विशेष चरण में बनाई गई विधि या पसंद की समीक्षा की जाएगी। बाद के चरण के परिणामों के आधार पर।

एक पूर्वानुमान समस्या को चुनने में, जिसमें आप रुचि रखते हैं, आप डिजाइनिंग के तीन चरणों के बारे में सोच सकते हैं और एक गहरी शिक्षण प्रणाली का उपयोग कर सकते हैं: (i) डेटा प्रोसेसिंग चरण, उदाहरण के लिए, प्रशिक्षण चरण, एकत्रीकरण, प्रीप्रोसेसिंग, विज़ुअलाइज़ेशन, आदि (ii) प्रशिक्षण चरण, उदाहरण के लिए, एक मॉडल चुनना। तंत्रिका नेटवर्क, मॉडल के प्रशिक्षण के लिए कार्यों और विधियों की परिभाषा, (iii) सत्यापन और विश्लेषण के चरण, जहां प्राप्त आंकड़ों के आधार पर, प्रभावशीलता का एक मूल्यांकन किया जाता है, साथ ही साथ, सामान्य तरीकों के छिपे हुए अभ्यावेदन और अपमानजनक अध्ययन का विश्लेषण और व्याख्या भी की जाती है।

स्वाभाविक रूप से, ये तीन चरण एक दूसरे का अनुसरण करते हैं। हालांकि, बहुत बार एक गहरी शिक्षा प्रणाली बनाने का पहला प्रयास असफल होता है। समस्याओं को हल करने के लिए, डिजाइन प्रक्रिया की पुनरावृत्ति प्रकृति को याद रखना महत्वपूर्ण है, जिसमें विभिन्न चरणों के परिणाम वास्तुकला की समीक्षा और अन्य चरणों के पुन: क्रियान्वयन के लिए आधार के रूप में कार्य करते हैं।

पर चित्रा 1 द्विपक्षीय जोड़ने तीर के साथ आम पुनरावृत्तियों की शो उदाहरण: (i) तीर दोहराएं (1) है, जो प्रक्रिया डेटा संग्रह में यात्रा से मेल खाती है, क्योंकि यह होता है कि डेटा दृश्य की प्रक्रिया के बाद leyblinga कच्चे डेटा को समायोजित करने की, के बाद से परिणाम भी था आवश्यकता हो सकती है शोर या वांछित लक्ष्य पर कब्जा नहीं किया; (ii) तीर Iterate (2), जो सीखने की प्रक्रिया में पुनरावृत्तियों से मेल खाती है, उदाहरण के लिए, यदि एक और लक्ष्य या विधि अधिक उपयुक्त है, या यदि सीखने की प्रक्रिया को कई चरणों में विभाजित करने की आवश्यकता है, पहले आत्म-पर्यवेक्षण का संचालन करना , और फिर शिक्षक के साथ प्रशिक्षण; (iii) Iterate एरो (3) , जो प्रशिक्षण चरण के परिणामों के आधार पर डेटा प्रोसेसिंग चरणों को बदलने के लिए जिम्मेदार है; (iv) तीर Iterate (4)प्रशिक्षण समय को कम करने या एक सरल मॉडल का उपयोग करने के लिए मान्यता चरण में प्राप्त परिणामों के आधार पर सीखने की प्रक्रिया की वास्तुकला को बदलने के लिए जिम्मेदार है; (v) Iterate एरो (5) सत्यापन / विश्लेषण परिणामों के आधार पर डेटा प्रोसेसिंग चरणों का एक अनुकूलन है, उदाहरण के लिए, जब मॉडल झूठे डेटा विशेषताओं पर निर्भर करता है, और इससे बचने के लिए डेटा को फिर से तैयार किया जाना चाहिए।

अनुसंधान फोकस और नामकरण


इस खंड में, हम प्रशिक्षण चरण में उपयोग की जाने वाली कई विधियों के साथ-साथ कुछ तरीकों के बारे में बात करेंगे जो डेटा प्रोसेसिंग और सत्यापन चरणों की विशेषता हैं (उदाहरण के लिए, वृद्धि, व्याख्या और प्रतिनिधित्व का विश्लेषण)।

प्रशिक्षण चरण में, हम लोकप्रिय मॉडल, कार्यों और विधियों पर विचार करते हैं। मॉडलों द्वारा (जिसे कभी-कभी वास्तुकला भी कहा जाता है) हम गहन सीखने के तंत्रिका नेटवर्क की संरचना को समझते हैं - परतों की संख्या, उनका प्रकार, न्यूरॉन्स की संख्या, आदि। उदाहरण के लिए, छवियों को वर्गीकृत करने के कार्य में, चित्र इनपुट होते हैं, और विभिन्न श्रेणियों (या कक्षाओं) के सेट (असतत) से अधिक संभावना वितरण होता है। तरीकों से हमारा मतलब है कि सिस्टम को प्रशिक्षित करने के लिए किस प्रकार का प्रशिक्षण दिया जाता है। उदाहरण के लिए, एक शिक्षक के साथ सीखना एक लोकप्रिय सीखने की प्रक्रिया है जब एक तंत्रिका नेटवर्क टैग किए गए डेटा प्राप्त करता है, जहां लेबल टिप्पणियों का संकेत देते हैं।

विभिन्न मॉडलों और कार्यों के विपरीत, विधियां अन्य विधियों के सबसेट हो सकती हैं। उदाहरण के लिए, आत्म-पर्यवेक्षण- यह एक विधि है जिसमें एक तंत्रिका नेटवर्क को डेटा इंस्टेंसेस और लेबल पर प्रशिक्षित किया जाता है, जहां डेटा इंस्टेंसेस पर स्वचालित रूप से लेबल बनाए जाते हैं, इस पद्धति को भी एक शिक्षक के साथ शिक्षण विधियों के लिए जिम्मेदार ठहराया जा सकता है। यह थोड़ा भ्रमित करने वाला लगता है! हालांकि, इस स्तर पर, कम से कम मॉडल, समस्याओं और तरीकों की सामान्य समझ होना पर्याप्त है।

गहरी शिक्षा का उपयोग करें या नहीं?


गहरी शिक्षा के विभिन्न तरीकों में गोता लगाने से पहले, समस्या को तैयार करना और यह समझना महत्वपूर्ण है कि क्या गहरी शिक्षा इसे हल करने के लिए सही उपकरण प्रदान करेगी। तंत्रिका नेटवर्क के शक्तिशाली बुनियादी मॉडल कई जटिल कार्यक्षमताएं प्रदान करते हैं, जैसे कि जटिल छवि परिवर्तन। हालांकि, कई मामलों में, गहरी शिक्षा सबसे अच्छा पहला कदम नहीं हो सकता है या समस्या को हल करने के लिए उपयुक्त नहीं हो सकता है। नीचे हम संक्षेप में सबसे आम मशीन सीखने के तरीकों की समीक्षा करते हैं, खासकर वैज्ञानिक संदर्भों में।

आयाम में कमी और क्लस्टरिंग। वैज्ञानिक समुदाय में, डेटा विश्लेषण का अंतिम लक्ष्य उन बुनियादी तंत्रों को समझना है जो डेटा में पैटर्न उत्पन्न करते हैं। जब लक्ष्य ऐसा होता है, तो छिपे हुए डेटा गुणों को प्रकट करने के लिए आयामीता में कमी और क्लस्टरिंग सरल लेकिन बेहद प्रभावी तरीके होते हैं। वे अक्सर शोध और डेटा को विज़ुअलाइज़ करने के चरण में उपयोगी साबित होते हैं (भले ही बाद में अधिक जटिल तरीकों का उपयोग किया जाता है)।

आयाम में कमी।आयाम में कमी के तरीके रैखिक हैं, अर्थात, वे डेटा आयाम, या nonlinear को कम करने के लिए रैखिक परिवर्तनों पर आधारित हैं, अर्थात, nonlinear डेटा संरचना के अनुमानित संरक्षण के साथ आयाम को कम करते हैं। आयामीता को कम करने के लिए लोकप्रिय रैखिक विधियां प्रमुख घटक विधि और गैर-नकारात्मक मैट्रिक्स अपघटन हैं, जबकि गैर-रेखीय विधियां टी-वितरण और यूएमएपी के साथ पड़ोसियों के स्टोकेस्टिक एम्बेडिंग हैं। कई आयामी कमी के तरीकों में पहले से ही scikit-learn या github (जैसे github.com/oreillymedia/t-SNE-tutorial या github.com/lmcinnes/umap ) जैसे पैकेज में गुणवत्ता कार्यान्वयन है

क्लस्टरिंग। आयामी कमी के साथ संयोजन के रूप में अक्सर इस्तेमाल की जाने वाली क्लस्टरिंग तकनीक डेटा सेट में समानता और अंतर की पहचान करने का एक शक्तिशाली तरीका प्रदान करती है। तरीकों का आमतौर पर उपयोग किया जाता है, जैसे कि k- साधन विधि (अक्सर संशोधित k- साधन विधि), Gaussian वितरण, श्रेणीबद्ध क्लस्टरिंग और वर्णक्रमीय क्लस्टरिंग का एक मिश्रण मॉडल। डायमेंशनल रिडक्शन मेथड्स की तरह, क्लस्टरिंग मेथड्स में स्किकिट-लर्न जैसे पैकेज में अच्छा कार्यान्वयन होता है

रैखिक प्रतिगमन, लॉजिस्टिक प्रतिगमन (और विविधताएं)। शायद एक शिक्षक के साथ शिक्षण की समस्या को हल करने के लिए सबसे बुनियादी तरीके, जैसे कि वर्गीकरण और प्रतिगमन, रैखिक और उपस्कर प्रतिगमन और उनके रूपांतर (उदाहरण के लिए, लास्सो और रिज प्रतिगमन) सीमित डेटा के मामले में विशेष रूप से उपयोगी हो सकते हैं और एक स्पष्ट सेट (संभवतः पूर्व-संसाधित) विशेषताएं हैं (उदाहरण के लिए, सारणीबद्ध डेटा के रूप में)। ये विधियाँ समस्या के सूत्रीकरण की पर्याप्तता का मूल्यांकन करना भी संभव बनाती हैं और समस्या के सरल संस्करण की जाँच के लिए एक अच्छा प्रारंभिक बिंदु हो सकता है। इसकी सादगी के कारण, रैखिक और लॉजिस्टिक रेजिमेंट अत्यधिक व्याख्यात्मक हैं और विशेषता रोपण करने के लिए सरल तरीके प्रदान करते हैं।

निर्णय के पेड़, यादृच्छिक वन और ग्रेडिंग बूस्टिंग। अन्य लोकप्रिय तरीकों की श्रेणी में निर्णय पेड़, रैंडम फ़ॉरेस्ट और ग्रेडिएंट बूस्टिंग हैं। ये विधियां प्रतिगमन / वर्गीकरण समस्याओं के साथ संयोजन के रूप में भी काम कर सकती हैं और इनपुट और आउटपुट के बीच गैर-रैखिक संबंधों को मॉडलिंग करने के लिए अच्छी तरह से अनुकूल हैं। यादृच्छिक वन, जो निर्णय पेड़ों के कलाकारों की टुकड़ी का हिस्सा है, अक्सर उन स्थितियों में गहरी सीखने के तरीकों को पसंद किया जा सकता है जहां डेटा का कम सिग्नल-टू-शोर अनुपात होता है। ये विधियां रैखिक / उपस्कर प्रतिगमन की तुलना में कम व्याख्यात्मक हो सकती हैं, हालांकि, हाल ही में एक काम में, हमने विकास के तहत सॉफ्टवेयर पुस्तकालयों को देखा जो इस समस्या को हल करते हैं।

अन्य तरीके और संसाधन। उपरोक्त सभी विधियों, साथ ही साथ कई अन्य लोकप्रिय तरीकों, जैसे कि ग्राफिकल मॉडल, गॉसियन प्रक्रिया, बायेसियन ऑप्टिमाइज़ेशन, पर टोरंटो विश्वविद्यालय के मशीन लर्निंग कोर्स या स्टैनफोर्ड CS229 में, ddl.ai जैसे इंटरएक्टिव ट्यूटोरियल्स के बारे में विस्तृत लेख में चर्चा की गई है। /index.html (जिसे डीप लर्निंग में गोता कहा जाता है) और github.com/rasbt/python-machine-learning-book2nd-edition पर



डेटा वैज्ञानिक किन कार्यों को हल करता है? गणित के कौन से भाग और किन कार्यों के लिए आपको जानने की आवश्यकता है? डेटा वैज्ञानिकों के लिए क्या आवश्यकताएं हैं? भीड़ से बाहर निकलने और कैरियर की प्रगति के लिए गणित में क्या ज्ञान आवश्यक है ? इन सभी सवालों के जवाब और न केवल हमारे मुफ्त वेबिनार पर प्राप्त किए जा सकते हैं , जो 6 मई को आयोजित किया जाएगा। साइन अप करने के लिए जल्दी करो !



All Articles