मशीन सीखने को समझने के लिए तीन चित्रः बुनियादी अवधारणाएं, पांच प्रमुख शैलियों और नौ सामान्य एल्गोरिदम

लेखक:आविष्कारक मात्रा - छोटे सपने, बनाया गयाः 2017-05-02 14:49:49, अद्यतन किया गयाः

मशीन सीखने को समझने के लिए तीन चित्रः बुनियादी अवधारणाएं, पांच प्रमुख शैलियों और नौ सामान्य एल्गोरिदम

  • ################################################################################################################################################################

三张图读懂机器学习 :基本概念、五大流派与九种常见算法

  1. मशीन लर्निंग क्या है?

    मशीनें बड़ी मात्रा में डेटा का विश्लेषण करके सीखती हैं। उदाहरण के लिए, उन्हें प्रोग्रामिंग के माध्यम से बिल्ली या चेहरे को पहचानने की आवश्यकता नहीं है, उन्हें चित्रों का उपयोग करके प्रशिक्षित किया जा सकता है ताकि वे विशिष्ट लक्ष्यों को संक्षेप में और पहचान सकें।

  2. मशीन लर्निंग और एआई के बीच संबंध

    मशीन लर्निंग अनुसंधान और एल्गोरिदम का एक विषय है जो डेटा में पैटर्न की तलाश और उन पैटर्नों का उपयोग करके भविष्यवाणियां करने के लिए केंद्रित है। मशीन लर्निंग कृत्रिम बुद्धिमत्ता के क्षेत्र का हिस्सा है और ज्ञान खोज और डेटा खनन के साथ संरेखित है।

    三张图读懂机器学习 :基本概念、五大流派与九种常见算法

  3. मशीन सीखने का तरीका

    1 डेटा चुनेंः अपने डेटा को तीन समूहों में विभाजित करेंः प्रशिक्षण डेटा, सत्यापन डेटा और परीक्षण डेटा 2 मॉडल डेटाः संबंधित विशेषताओं का उपयोग करके मॉडल बनाने के लिए प्रशिक्षण डेटा का उपयोग करें 3 सत्यापन मॉडलः अपने सत्यापन डेटा का उपयोग करके अपने मॉडल तक पहुँचें 4 परीक्षण मॉडलः अपने परीक्षण डेटा का उपयोग करके सत्यापित मॉडल के प्रदर्शन की जांच करें 5 मॉडल का उपयोग करेंः नए डेटा पर भविष्यवाणियां करने के लिए पूरी तरह से प्रशिक्षित मॉडल का उपयोग करें 6 अनुकूलन मॉडलः अधिक डेटा, अलग-अलग विशेषताओं या संशोधित पैरामीटर का उपयोग करके एल्गोरिदम के प्रदर्शन में सुधार

    三张图读懂机器学习 :基本概念、五大流派与九种常见算法

  4. मशीन सीखने का स्थान

    1 पारंपरिक प्रोग्रामिंगः सॉफ्टवेयर इंजीनियर समस्या को हल करने के लिए प्रोग्राम लिखता है। पहले कुछ डेटा होता है→ एक समस्या को हल करने के लिए, सॉफ्टवेयर इंजीनियर एक प्रक्रिया लिखता है जो मशीन को बताता है कि उसे क्या करना चाहिए→ कंप्यूटर इस प्रक्रिया का पालन करता है और परिणाम निकालता है 2 सांख्यिकीः विश्लेषकों ने चरों के बीच संबंधों की तुलना की 3 मशीन लर्निंगः डेटा वैज्ञानिक प्रशिक्षण डेटासेट का उपयोग करके कंप्यूटर को सिखाता है कि उसे क्या करना चाहिए, और फिर सिस्टम उस कार्य को निष्पादित करता है। सबसे पहले बड़े डेटा होते हैं→ मशीनें प्रशिक्षण डेटासेट का उपयोग करके वर्गीकरण करना सीखती हैं, लक्ष्य वर्गीकरण को प्राप्त करने के लिए विशिष्ट एल्गोरिदम को समायोजित करती हैं→ कंप्यूटर डेटा में संबंधों, रुझानों और पैटर्न की पहचान करना सीखता है 4 स्मार्ट एप्लीकेशनः स्मार्ट एप्लीकेशन का उपयोग करके ए.आई. के परिणाम, जैसा कि चित्र में दिखाया गया है, एक सटीक कृषि के उपयोग के उदाहरण हैं, जो ड्रोन द्वारा एकत्र किए गए डेटा पर आधारित हैं

    三张图读懂机器学习 :基本概念、五大流派与九种常见算法

  5. मशीन सीखने के व्यावहारिक अनुप्रयोग

    मशीन लर्निंग के लिए बहुत सारे अनुप्रयोग हैं, यहाँ कुछ उदाहरण दिए गए हैं, आप इसका उपयोग कैसे करेंगे?

    तेजी से तीन आयामी मानचित्रण और मॉडलिंगः एक रेलवे पुल बनाने के लिए, पीडब्ल्यूसी के डेटा वैज्ञानिकों और क्षेत्र के विशेषज्ञों ने मशीन सीखने को ड्रोन द्वारा एकत्र किए गए डेटा पर लागू किया। यह संयोजन काम की सफलता में सटीक निगरानी और तेजी से प्रतिक्रिया को सक्षम करता है।

    जोखिम को कम करने के लिए संवर्धित विश्लेषिकीः आंतरिक लेनदेन का पता लगाने के लिए, पीडब्ल्यूसी ने मशीन सीखने और अन्य विश्लेषणात्मक तकनीकों को एक साथ जोड़ा, जिससे अधिक व्यापक उपयोगकर्ता प्रोफाइल विकसित हुए और जटिल संदिग्ध व्यवहार के बारे में अधिक गहराई से पता चला।

    सबसे अच्छा प्रदर्शन करने वाले लक्ष्यों का अनुमान लगानाः पीडब्ल्यूसी ने मशीन सीखने और अन्य विश्लेषणात्मक तरीकों का उपयोग करके मेलबर्न कप के मैदान में विभिन्न घोड़ों की क्षमता का आकलन किया।

  • #########################################################

三张图读懂机器学习 :基本概念、五大流派与九种常见算法

दशकों से, एआई शोधकर्ताओं के विभिन्न "कुलों" ने एक दूसरे के लिए प्रभुत्व के लिए प्रतिस्पर्धा की है। क्या अब समय आ गया है कि वे एकजुट हों? और उन्हें ऐसा करना पड़ सकता है, क्योंकि सहयोग और एल्गोरिदम संलयन वास्तव में सार्वभौमिक एआई (एजीआई) को प्राप्त करने का एकमात्र तरीका है। यहां मशीन सीखने के तरीकों के विकास का रास्ता और भविष्य के संभावित रूप दिए गए हैं।

  1. पांच प्रमुख शैलियों

    1 प्रतीकवादः ज्ञान को दर्शाता है और तार्किक तर्क करने के लिए प्रतीकों, नियमों और तर्क का उपयोग करता है, पसंदीदा एल्गोरिदम हैंः नियम और निर्णय पेड़ 2 बेयिसवादः होने की संभावनाओं को प्राप्त करने के लिए संभावना तर्क, पसंदीदा एल्गोरिदमः सरल बेयिस या मार्कोव 3 कनेक्टिविटीः संभावित मैट्रिक्स और भारित न्यूरॉन्स का उपयोग करके गतिशील रूप से पैटर्न की पहचान और समाकलन करने के लिए, पसंदीदा एल्गोरिथ्म हैः तंत्रिका नेटवर्क 4 विकासवादः परिवर्तन उत्पन्न करना और फिर एक विशिष्ट लक्ष्य के लिए उनमें से सर्वश्रेष्ठ को प्राप्त करना, पसंदीदा एल्गोरिदम हैः आनुवंशिक एल्गोरिदम 5 Analogizer: प्रतिबंधित परिस्थितियों के अनुसार फ़ंक्शन को अनुकूलित करने के लिए (जितना संभव हो उतना ऊंचा जाना, लेकिन साथ ही साथ सड़क से बाहर नहीं जाना) पसंदीदा एल्गोरिथ्म हैः वेक्टर मशीन का समर्थन करें

    三张图读懂机器学习 :基本概念、五大流派与九种常见算法

  2. विकास के चरण

    1980 के दशक

    प्रमुख शैलीः प्रतीकवाद आर्किटेक्चरः सर्वर या मेजर प्रमुख सिद्धांतः ज्ञान इंजीनियरिंग बुनियादी निर्णय तर्कः निर्णय समर्थन प्रणाली, सीमित उपयोगिता

    1990 से 2000 तक

    मुख्य शैलीः बेयर्स आर्किटेक्चरः छोटे सर्वर क्लस्टर प्रमुख सिद्धांतः संभावना सिद्धांत वर्गीकरणः स्केलेबल तुलना या विपरीत, कई कार्यों के लिए पर्याप्त है

    2010 के दशक की शुरुआत और मध्य

    प्रमुख शैलीः एकतावाद आर्किटेक्चरः बड़े सर्वर फार्म प्रमुख सिद्धांतः तंत्रिका विज्ञान और संभावनाएं पहचानः अधिक सटीक छवि और आवाज पहचान, अनुवाद, भावना विश्लेषण आदि

    三张图读懂机器学习 :基本概念、五大流派与九种常见算法

  3. इन शैलियों को एक साथ काम करने और अपने तरीकों को एक साथ लाने की उम्मीद है।

    2010 के दशक के अंत में

    मुख्य शैलीः संघवाद + प्रतीकवाद वास्तुकलाः कई बादल प्रमुख सिद्धांतः स्मृति तंत्रिका नेटवर्क, बड़े पैमाने पर एकीकरण, ज्ञान आधारित तर्क सरल प्रश्न और उत्तरः संकीर्ण, क्षेत्र-विशिष्ट ज्ञान साझा करना

    2020 के दशक +

    मुख्य शैलियोंः संघवाद + प्रतीकवाद + बेयर्स +... आर्किटेक्चरः क्लाउड कंप्यूटिंग और धुंध कंप्यूटिंग प्रमुख सिद्धांतः जब धारणा होती है तो नेटवर्क होता है, जब तर्क और काम होता है तो नियम होते हैं सरल धारणा, तर्क और कार्रवाईः सीमित स्वचालन या मानव-रचना बातचीत

    2040 के दशक +

    मुख्य शैलीः एल्गोरिदम का एकीकरण आर्किटेक्चरः सर्वव्यापी सर्वर मुख्य सिद्धांतः सर्वोत्तम संयोजन के लिए मेटालर्निंग धारणा और प्रतिक्रियाः कई सीखने के तरीकों से प्राप्त ज्ञान या अनुभव के आधार पर कार्रवाई या प्रतिक्रिया करना

  • ###############################################################################################################################

三张图读懂机器学习 :基本概念、五大流派与九种常见算法

आपको कौन सा मशीन लर्निंग एल्गोरिथ्म उपयोग करना चाहिए? यह काफी हद तक उपलब्ध डेटा की प्रकृति और मात्रा और प्रत्येक विशिष्ट उपयोग के मामले में आपके प्रशिक्षण लक्ष्यों पर निर्भर करता है. सबसे जटिल एल्गोरिथ्म का उपयोग न करें, जब तक कि इसका परिणाम महंगा खर्च और संसाधनों के लायक न हो। यहां कुछ सबसे आम एल्गोरिथ्म दिए गए हैं, जिनका उपयोग करने में आसानी के अनुसार क्रमबद्ध किया गया है।

  1. निर्णय वृक्षः चरणबद्ध प्रतिक्रिया के दौरान, एक विशिष्ट निर्णय वृक्ष विश्लेषण में स्तरीकृत चर या निर्णय नोड्स का उपयोग किया जाता है, उदाहरण के लिए, किसी दिए गए उपयोगकर्ता को क्रेडिट विश्वसनीय या अविश्वसनीय के रूप में वर्गीकृत किया जाता है।

    गुणः लोगों, स्थानों और वस्तुओं के विभिन्न लक्षणों, गुणों और विशेषताओं का मूल्यांकन करने में कुशल परिदृश्य उदाहरणः नियम आधारित क्रेडिट मूल्यांकन, घोड़े के परिणामों का पूर्वानुमान

    三张图读懂机器学习 :基本概念、五大流派与九种常见算法

  2. समर्थन वेक्टर मशीनः हाइपरप्लेन पर आधारित, समर्थन वेक्टर मशीन जो डेटासेट को वर्गीकृत कर सकती है।

    लाभः वेक्टर मशीनों का समर्थन करता है जो चर X और अन्य चरों के बीच द्विआधारी वर्गीकरण ऑपरेशन करने में माहिर हैं, चाहे उनका संबंध रैखिक हो या नहीं उदाहरण के लिएः समाचार वर्गीकरण, हस्तलिखित पहचान।

  3. पुनरावृत्ति (Regression): पुनरावृत्ति में एक कारण चर और एक या अधिक कारण चर के बीच स्थितियों के संबंध को रेखांकित किया जा सकता है। इस उदाहरण में, स्पैम और गैर-स्पैम के बीच अंतर किया गया है।

    लाभः पुनरावृत्ति का उपयोग चर के बीच निरंतर संबंधों की पहचान करने के लिए किया जा सकता है, भले ही संबंध बहुत स्पष्ट न हो उदाहरणः सड़क यातायात यातायात विश्लेषण, मेल फ़िल्टरिंग

    三张图读懂机器学习 :基本概念、五大流派与九种常见算法

  4. Naive Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification

    लाभः एक छोटे से डेटासेट में महत्वपूर्ण विशेषताओं वाले संबंधित वस्तुओं के लिए, सरल बेयर्स विधि उन्हें जल्दी से वर्गीकृत कर सकती है उदाहरणः भावना विश्लेषण, उपभोक्ता वर्गीकरण

  5. छिपे हुए मार्कोव मॉडलः प्रकट मार्कोव प्रक्रिया पूरी तरह से निश्चित है कि एक निश्चित स्थिति अक्सर एक अन्य स्थिति के साथ होती है; ट्रैफिक लाइट एक उदाहरण है; इसके विपरीत, छिपे हुए मार्कोव मॉडल दृश्य डेटा का विश्लेषण करके छिपे हुए राज्य की घटनाओं का अनुमान लगाते हैं; फिर, छिपे हुए राज्य विश्लेषण के साथ, छिपे हुए मार्कोव मॉडल संभावित भविष्य के अवलोकन पैटर्न का अनुमान लगाते हैं; इस मामले में, उच्च या निम्न वायु दबाव की संभावना (जो छिपे हुए है) को अच्छे दिन, बारिश या बादल के दिन की संभावना का अनुमान लगाने के लिए इस्तेमाल किया जा सकता है।

    लाभः डेटा की परिवर्तनशीलता को अनुमति देता है, पहचान और पूर्वानुमान संचालन के लिए उपयुक्त है दृश्य उदाहरणः चेहरे के भाव विश्लेषण, मौसम पूर्वानुमान

    三张图读懂机器学习 :基本概念、五大流派与九种常见算法

  6. यादृच्छिक वनः यादृच्छिक वन एल्गोरिदम ने कई वृक्षों का उपयोग करके निर्णय वृक्षों की सटीकता में सुधार किया है, जिनमें यादृच्छिक रूप से चुने गए डेटा के सबसेट हैं। इस उदाहरण में स्तन कैंसर के पुनरावृत्ति के साथ जुड़े बहुत सारे जीन को जीन अभिव्यक्ति के स्तर पर देखा गया है और पुनरावृत्ति के जोखिम की गणना की गई है।

    लाभः रैंडम फॉरेस्टिंग का तरीका बड़े डेटासेट और कई और कभी-कभी असंबद्ध विशेषताओं वाले आइटमों के लिए उपयोगी साबित होता है उदाहरणः उपयोगकर्ता हानि विश्लेषण, जोखिम आकलन

  7. आवर्ती तंत्रिका नेटवर्क (RNN): किसी भी तंत्रिका नेटवर्क में, प्रत्येक तंत्रिका एक या अधिक छिपे हुए परतों के माध्यम से कई इनपुट को एक एकल आउटपुट में परिवर्तित करती है। आवर्ती तंत्रिका नेटवर्क (RNN) मानों को आगे लेयर-बाय-लेयर पारित करता है, जिससे लेयर-बाय-लेयर सीखने की संभावना होती है। दूसरे शब्दों में, RNN में किसी प्रकार की स्मृति होती है, जो पिछले आउटपुट को बाद के इनपुट को प्रभावित करने की अनुमति देती है।

    लाभः सर्कुलर तंत्रिका नेटवर्क बहुत अधिक व्यवस्थित जानकारी के साथ भविष्यवाणी करने में सक्षम है दृश्य उदाहरणः छवि वर्गीकरण और उपशीर्षक जोड़ना, राजनीतिक भावना विश्लेषण

    三张图读懂机器学习 :基本概念、五大流派与九种常见算法

  8. लंबी अल्पकालिक स्मृति (LSTM) और गेट किए गए आवर्ती इकाई तंत्रिका नेटवर्क (gated recurrent unit neural network): आरंभिक RNN के प्रारम्भिक रूपों में हानि होती है। हालांकि ये आरंभिक आवर्ती तंत्रिका नेटवर्क केवल छोटी मात्रा में प्रारंभिक सूचनाओं को रखने की अनुमति देते हैं, नए दीर्घकालिक स्मृति (LSTM) और गेट किए गए आवर्ती इकाई (GRU) तंत्रिका नेटवर्क में दीर्घकालिक और अल्पकालिक स्मृति दोनों होती है। दूसरे शब्दों में, इन नए आरएनएन में बेहतर नियंत्रण स्मृति क्षमता होती है, जो पहले के प्रसंस्करण को बनाए रखने की अनुमति देती है या जब कई श्रृंखला चरणों की आवश्यकता होती है, तो इन मानों को फिर से सेट करती है, जिससे "गतिशील गिरावट" या अंतिम गिरावट से बचा जा सकता है।

    लाभः दीर्घकालिक और अल्पावधि स्मृति और गेट-नियंत्रित परिपत्र तंत्रिका नेटवर्क में अन्य परिपत्र तंत्रिका नेटवर्क के समान लाभ हैं, लेकिन बेहतर स्मृति क्षमता के कारण अधिक बार उपयोग किया जाता है उदाहरणः प्राकृतिक भाषा प्रसंस्करण, अनुवाद

  9. घुमावदार तंत्रिका नेटवर्क (convolutional neural network): घुमावदार होने का अर्थ है कि एक दूसरे के बाद के परतों के भार का एकीकरण, जिसका उपयोग आउटपुट परतों को चिह्नित करने के लिए किया जा सकता है।

    लाभः जब बहुत बड़े डेटासेट, बहुत सारी विशेषताएं और जटिल वर्गीकरण कार्य होते हैं, तो घुमावदार तंत्रिका नेटवर्क बहुत उपयोगी होते हैं दृश्य उदाहरणः छवि पहचान, पाठ अनुवाद, दवा का पता लगाना

  • #### मूल लिंकः

http://usblogs.pwc.com/emerging-technology/a-look-at-machine-learning-infographic/

http://usblogs.pwc.com/emerging-technology/machine-learning-methods-infographic/

http://usblogs.pwc.com/emerging-technology/machine-learning-evolution-infographic/

बड़े डेटा प्लेट से पुनर्प्रकाशित


अधिक जानकारी