मशीन लर्निंग क्या है?
मशीनें बड़ी मात्रा में डेटा का विश्लेषण करके सीखती हैं। उदाहरण के लिए, उन्हें प्रोग्रामिंग के माध्यम से बिल्ली या चेहरे को पहचानने की आवश्यकता नहीं है, उन्हें चित्रों का उपयोग करके प्रशिक्षित किया जा सकता है ताकि वे विशिष्ट लक्ष्यों को संक्षेप में और पहचान सकें।
मशीन लर्निंग और एआई के बीच संबंध
मशीन लर्निंग अनुसंधान और एल्गोरिदम का एक विषय है जो डेटा में पैटर्न की तलाश और उन पैटर्नों का उपयोग करके भविष्यवाणियां करने के लिए केंद्रित है। मशीन लर्निंग कृत्रिम बुद्धिमत्ता के क्षेत्र का हिस्सा है और ज्ञान खोज और डेटा खनन के साथ संरेखित है।
मशीन सीखने का तरीका
1 डेटा चुनेंः अपने डेटा को तीन समूहों में विभाजित करेंः प्रशिक्षण डेटा, सत्यापन डेटा और परीक्षण डेटा 2 मॉडल डेटाः संबंधित विशेषताओं का उपयोग करके मॉडल बनाने के लिए प्रशिक्षण डेटा का उपयोग करें 3 सत्यापन मॉडलः अपने सत्यापन डेटा का उपयोग करके अपने मॉडल तक पहुँचें 4 परीक्षण मॉडलः अपने परीक्षण डेटा का उपयोग करके सत्यापित मॉडल के प्रदर्शन की जांच करें 5 मॉडल का उपयोग करेंः नए डेटा पर भविष्यवाणियां करने के लिए पूरी तरह से प्रशिक्षित मॉडल का उपयोग करें 6 अनुकूलन मॉडलः अधिक डेटा, अलग-अलग विशेषताओं या संशोधित पैरामीटर का उपयोग करके एल्गोरिदम के प्रदर्शन में सुधार
मशीन सीखने का स्थान
1 पारंपरिक प्रोग्रामिंगः सॉफ्टवेयर इंजीनियर समस्या को हल करने के लिए प्रोग्राम लिखता है। पहले कुछ डेटा होता है→ एक समस्या को हल करने के लिए, सॉफ्टवेयर इंजीनियर एक प्रक्रिया लिखता है जो मशीन को बताता है कि उसे क्या करना चाहिए→ कंप्यूटर इस प्रक्रिया का पालन करता है और परिणाम निकालता है 2 सांख्यिकीः विश्लेषकों ने चरों के बीच संबंधों की तुलना की 3 मशीन लर्निंगः डेटा वैज्ञानिक प्रशिक्षण डेटासेट का उपयोग करके कंप्यूटर को सिखाता है कि उसे क्या करना चाहिए, और फिर सिस्टम उस कार्य को निष्पादित करता है। सबसे पहले बड़े डेटा होते हैं → मशीनें प्रशिक्षण डेटासेट का उपयोग करके वर्गीकरण करना सीखती हैं, लक्ष्य वर्गीकरण को प्राप्त करने के लिए विशिष्ट एल्गोरिदम को समायोजित करती हैं → कंप्यूटर डेटा में संबंधों, रुझानों और पैटर्न की पहचान करना सीखता है 4 स्मार्ट एप्लीकेशनः स्मार्ट एप्लीकेशन का उपयोग करके एआई के परिणाम, जैसा कि चित्र में दिखाया गया है, एक सटीक कृषि अनुप्रयोग का उदाहरण है, जो ड्रोन द्वारा एकत्र किए गए डेटा पर आधारित है
मशीन सीखने के व्यावहारिक अनुप्रयोग
मशीन लर्निंग के लिए बहुत सारे अनुप्रयोग हैं, यहाँ कुछ उदाहरण दिए गए हैं, आप इसका उपयोग कैसे करेंगे?
तेजी से तीन आयामी मानचित्रण और मॉडलिंगः एक रेलवे पुल बनाने के लिए, पीडब्ल्यूसी के डेटा वैज्ञानिकों और क्षेत्र के विशेषज्ञों ने मशीन सीखने को ड्रोन द्वारा एकत्र किए गए डेटा पर लागू किया। यह संयोजन काम की सफलता में सटीक निगरानी और तेजी से प्रतिक्रिया को सक्षम करता है।
जोखिम को कम करने के लिए संवर्धित विश्लेषिकीः आंतरिक लेनदेन का पता लगाने के लिए, पीडब्ल्यूसी ने मशीन सीखने और अन्य विश्लेषणात्मक तकनीकों को एक साथ जोड़ा, जिससे अधिक व्यापक उपयोगकर्ता प्रोफाइल विकसित हुए और जटिल संदिग्ध व्यवहार के बारे में अधिक गहराई से पता चला।
सबसे अच्छा प्रदर्शन करने वाले लक्ष्यों का अनुमान लगानाः पीडब्ल्यूसी ने मशीन सीखने और अन्य विश्लेषणात्मक तरीकों का उपयोग करके मेलबर्न कप के मैदान में विभिन्न घोड़ों की क्षमता का आकलन किया।
दशकों से, एआई शोधकर्ताओं के विभिन्न "कुलों" ने एक दूसरे के लिए प्रभुत्व के लिए प्रतिस्पर्धा की है। क्या अब समय आ गया है कि वे एकजुट हों? और उन्हें ऐसा करना पड़ सकता है, क्योंकि सहयोग और एल्गोरिदम संलयन वास्तव में सार्वभौमिक एआई (एजीआई) को प्राप्त करने का एकमात्र तरीका है। यहां मशीन सीखने के तरीकों के विकास का रास्ता और भविष्य के संभावित रूप दिए गए हैं।
पांच प्रमुख शैलियों
1 प्रतीकवादः ज्ञान को दर्शाता है और तार्किक तर्क करने के लिए प्रतीकों, नियमों और तर्क का उपयोग करता है, पसंदीदा एल्गोरिदम हैंः नियम और निर्णय पेड़ 2 बेयिसवादः होने की संभावनाओं को प्राप्त करने के लिए संभावना तर्क, पसंदीदा एल्गोरिदमः सरल बेयिस या मार्कोव 3 कनेक्टिविटीः संभावित मैट्रिक्स और भारित न्यूरॉन्स का उपयोग करके गतिशील रूप से पैटर्न की पहचान और समाकलन करने के लिए, पसंदीदा एल्गोरिथ्म हैः तंत्रिका नेटवर्क 4 विकासवादः परिवर्तन उत्पन्न करना और फिर एक विशिष्ट लक्ष्य के लिए उनमें से सर्वश्रेष्ठ को प्राप्त करना, पसंदीदा एल्गोरिदम हैः आनुवंशिक एल्गोरिदम 5 Analogizer: प्रतिबंधित परिस्थितियों के अनुसार फ़ंक्शन को अनुकूलित करने के लिए (जितना संभव हो उतना ऊंचा जाना, लेकिन साथ ही साथ सड़क से बाहर नहीं जाना) पसंदीदा एल्गोरिथ्म हैः वेक्टर मशीन का समर्थन करें
विकास के चरण
1980 के दशक
प्रमुख शैलीः प्रतीकवाद आर्किटेक्चरः सर्वर या मेजर प्रमुख सिद्धांतः ज्ञान इंजीनियरिंग बुनियादी निर्णय तर्कः निर्णय समर्थन प्रणाली, सीमित उपयोगिता
1990 से 2000 तक
मुख्य शैलीः बेयर्स आर्किटेक्चरः छोटे सर्वर क्लस्टर प्रमुख सिद्धांतः संभावना सिद्धांत वर्गीकरणः स्केलेबल तुलना या विपरीत, कई कार्यों के लिए पर्याप्त है
2010 के दशक की शुरुआत और मध्य
प्रमुख शैलीः संघवाद आर्किटेक्चरः बड़े सर्वर फार्म प्रमुख सिद्धांतः तंत्रिका विज्ञान और संभावनाएं पहचानः अधिक सटीक छवि और आवाज पहचान, अनुवाद, भावना विश्लेषण आदि
इन शैलियों को एक साथ काम करने और अपने तरीकों को एक साथ लाने की उम्मीद है।
2010 के दशक के अंत में
मुख्य शैलीः संघवाद + प्रतीकवाद वास्तुकलाः कई बादल प्रमुख सिद्धांतः स्मृति तंत्रिका नेटवर्क, बड़े पैमाने पर एकीकरण, ज्ञान आधारित तर्क सरल प्रश्न और उत्तरः संकीर्ण, क्षेत्र-विशिष्ट ज्ञान साझा करना
2020 के दशक +
मुख्य शैलियोंः संघवाद + प्रतीकवाद + बेयर्स +... आर्किटेक्चरः क्लाउड कंप्यूटिंग और धुंध कंप्यूटिंग प्रमुख सिद्धांतः जब धारणा होती है तो नेटवर्क होता है, जब तर्क और काम होता है तो नियम होते हैं सरल धारणा, तर्क और कार्रवाईः सीमित स्वचालन या मानव-रचना बातचीत
2040 के दशक +
मुख्य शैलीः एल्गोरिदम का एकीकरण आर्किटेक्चरः सर्वव्यापी सर्वर मुख्य सिद्धांतः सर्वोत्तम संयोजन के लिए मेटालर्निंग धारणा और प्रतिक्रियाः कई सीखने के तरीकों से प्राप्त ज्ञान या अनुभव के आधार पर कार्रवाई या प्रतिक्रिया करना
आपको कौन सा मशीन लर्निंग एल्गोरिथ्म उपयोग करना चाहिए? यह काफी हद तक उपलब्ध डेटा की प्रकृति और मात्रा और प्रत्येक विशिष्ट उपयोग के मामले में आपके प्रशिक्षण लक्ष्यों पर निर्भर करता है. सबसे जटिल एल्गोरिथ्म का उपयोग न करें, जब तक कि इसका परिणाम महंगा खर्च और संसाधनों के लायक न हो। यहां कुछ सबसे आम एल्गोरिथ्म दिए गए हैं, जिनका उपयोग करने में आसानी के अनुसार क्रमबद्ध किया गया है।
निर्णय वृक्षः चरणबद्ध प्रतिक्रिया के दौरान, एक विशिष्ट निर्णय वृक्ष विश्लेषण में स्तरीकृत चर या निर्णय नोड्स का उपयोग किया जाता है, उदाहरण के लिए, किसी दिए गए उपयोगकर्ता को क्रेडिट विश्वसनीय या अविश्वसनीय के रूप में वर्गीकृत किया जाता है।
गुणः लोगों, स्थानों और वस्तुओं के विभिन्न लक्षणों, गुणों और विशेषताओं का मूल्यांकन करने में कुशल परिदृश्य उदाहरणः नियम आधारित क्रेडिट मूल्यांकन, घोड़े के परिणामों का पूर्वानुमान
समर्थन वेक्टर मशीनः हाइपरप्लेन पर आधारित, समर्थन वेक्टर मशीन जो डेटासेट को वर्गीकृत कर सकती है।
लाभः वेक्टर मशीनों का समर्थन करता है जो चर X और अन्य चरों के बीच द्विआधारी वर्गीकरण ऑपरेशन करने में माहिर हैं, चाहे उनका संबंध रैखिक हो या नहीं उदाहरण के लिएः समाचार वर्गीकरण, हस्तलिखित पहचान।
पुनरावृत्ति (Regression): पुनरावृत्ति में एक कारण चर और एक या अधिक कारण चर के बीच स्थितियों के संबंध को रेखांकित किया जा सकता है। इस उदाहरण में, स्पैम और गैर-स्पैम के बीच अंतर किया गया है।
लाभः पुनरावृत्ति का उपयोग चर के बीच निरंतर संबंधों की पहचान करने के लिए किया जा सकता है, भले ही संबंध बहुत स्पष्ट न हो उदाहरणः सड़क यातायात यातायात विश्लेषण, मेल फ़िल्टरिंग
Naive Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification: Nave Bayes Classification
लाभः छोटे डेटासेट में महत्वपूर्ण विशेषताओं वाले संबंधित ऑब्जेक्टों के लिए, सरल बेयर्स विधि उन्हें जल्दी से वर्गीकृत कर सकती है उदाहरणः भावना विश्लेषण, उपभोक्ता वर्गीकरण
छिपे हुए मार्कोव मॉडलः प्रकट मार्कोव प्रक्रिया पूरी तरह से निश्चित है कि एक निश्चित स्थिति अक्सर एक अन्य स्थिति के साथ होती है; ट्रैफिक लाइट एक उदाहरण है; इसके विपरीत, छिपे हुए मार्कोव मॉडल दृश्य डेटा का विश्लेषण करके छिपे हुए राज्य की घटनाओं का अनुमान लगाते हैं; फिर, छिपे हुए राज्य विश्लेषण के साथ, छिपे हुए मार्कोव मॉडल संभावित भविष्य के अवलोकन पैटर्न का अनुमान लगाते हैं; इस मामले में, उच्च या निम्न वायु दबाव की संभावना (जो छिपे हुए है) को अच्छे दिन, बारिश या बादल के दिन की संभावना का अनुमान लगाने के लिए इस्तेमाल किया जा सकता है।
लाभः डेटा की परिवर्तनशीलता को अनुमति देता है, पहचान और पूर्वानुमान संचालन के लिए उपयुक्त है दृश्य उदाहरणः चेहरे के भाव विश्लेषण, मौसम पूर्वानुमान
यादृच्छिक वनः यादृच्छिक वन एल्गोरिदम ने कई वृक्षों का उपयोग करके निर्णय वृक्षों की सटीकता में सुधार किया है, जिनमें यादृच्छिक रूप से चुने गए डेटा के सबसेट हैं। इस उदाहरण में स्तन कैंसर के पुनरावृत्ति के साथ जुड़े बहुत सारे जीन को जीन अभिव्यक्ति के स्तर पर देखा गया है और पुनरावृत्ति के जोखिम की गणना की गई है।
लाभः रैंडम फॉरेस्टिंग का तरीका बड़े डेटासेट और कई और कभी-कभी असंबद्ध विशेषताओं वाले आइटमों के लिए उपयोगी साबित होता है उदाहरणः उपयोगकर्ता हानि विश्लेषण, जोखिम आकलन
आवर्ती तंत्रिका नेटवर्क (RNN): किसी भी तंत्रिका नेटवर्क में, प्रत्येक तंत्रिका एक या अधिक छिपे हुए परतों के माध्यम से कई इनपुट को एक एकल आउटपुट में परिवर्तित करती है। आवर्ती तंत्रिका नेटवर्क (RNN) मानों को आगे लेयर-बाय-लेयर पारित करता है, जिससे लेयर-बाय-लेयर सीखने की संभावना होती है। दूसरे शब्दों में, RNN में किसी प्रकार की स्मृति होती है, जो पिछले आउटपुट को बाद के इनपुट को प्रभावित करने की अनुमति देती है।
लाभः सर्कुलर तंत्रिका नेटवर्क बहुत अधिक व्यवस्थित जानकारी के साथ भविष्यवाणी करने में सक्षम है दृश्य उदाहरणः छवि वर्गीकरण और उपशीर्षक जोड़ना, राजनीतिक भावना विश्लेषण
लंबी अल्पकालिक स्मृति (LSTM) और गेट किए गए आवर्ती इकाई तंत्रिका नेटवर्क (gated recurrent unit neural network): आरंभिक RNN के प्रारम्भिक रूपों में हानि होती है। हालांकि ये आरंभिक आवर्ती तंत्रिका नेटवर्क केवल छोटी मात्रा में प्रारंभिक सूचनाओं को रखने की अनुमति देते हैं, नए दीर्घकालिक स्मृति (LSTM) और गेट किए गए आवर्ती इकाई (GRU) तंत्रिका नेटवर्क में दीर्घकालिक और अल्पकालिक स्मृति दोनों होती है। दूसरे शब्दों में, इन नए आरएनएन में बेहतर नियंत्रण स्मृति क्षमता होती है, जो पहले के प्रसंस्करण को बनाए रखने की अनुमति देती है या जब कई श्रृंखला चरणों की आवश्यकता होती है, तो इन मानों को फिर से सेट करती है, जिससे "गतिशील गिरावट" या अंतिम गिरावट से बचा जा सकता है।
लाभः दीर्घकालिक और अल्पावधि स्मृति और गेट-नियंत्रित परिपत्र तंत्रिका नेटवर्क के समान लाभ हैं, लेकिन बेहतर स्मृति क्षमता के कारण अधिक बार उपयोग किए जाते हैं उदाहरणः प्राकृतिक भाषा प्रसंस्करण, अनुवाद
घुमावदार तंत्रिका नेटवर्क (convolutional neural network): घुमावदार होने का अर्थ है कि एक दूसरे के बाद के परतों के भार का एकीकरण, जिसका उपयोग आउटपुट परतों को चिह्नित करने के लिए किया जा सकता है।
लाभः जब बहुत बड़े डेटासेट, बहुत सारी विशेषताएं और जटिल वर्गीकरण कार्य होते हैं, तो घुमावदार तंत्रिका नेटवर्क बहुत उपयोगी होते हैं दृश्य उदाहरणः छवि पहचान, पाठ अनुवाद, दवा का पता लगाना
http://usblogs.pwc.com/emerging-technology/a-look-at-machine-learning-infographic/
http://usblogs.pwc.com/emerging-technology/machine-learning-methods-infographic/
http://usblogs.pwc.com/emerging-technology/machine-learning-evolution-infographic/
बड़े डेटा प्लेट से पुनर्प्रकाशित