एक व्यक्ति के रूप में जो अक्सर गैर-पेशेवरों को मशीन सीखने के बारे में बताता है, मैंने निम्नलिखित दस बिंदुओं को मशीन सीखने के बारे में कुछ स्पष्टीकरण के रूप में संकलित किया है।
मशीन लर्निंग एक तरह का प्रचार नहीं है: आप उचित प्रशिक्षण डेटा के साथ उचित सीखने के एल्गोरिदम को प्रदान करके असंख्य कठिनाइयों को हल कर सकते हैं। इसे एआई कहें, अगर यह आपके एआई सिस्टम को बेचने में मदद करता है। लेकिन आपको पता होना चाहिए कि एआई सिर्फ एक फैशनेबल शब्द है, जो केवल लोगों की अपेक्षाओं का प्रतिनिधित्व करता है।
मशीन लर्निंग एल्गोरिदम, विशेष रूप से डीप लर्निंग में प्रगति के लिए कई रोमांचक जगहें हैं। लेकिन डेटा एक महत्वपूर्ण कारक है जो मशीन लर्निंग को संभव बनाता है। मशीन लर्निंग जटिल एल्गोरिदम के बिना हो सकती है, लेकिन अच्छे डेटा के बिना नहीं।
मशीन लर्निंग डेटा में पैटर्न के आधार पर मॉडल को प्रशिक्षित करता है, पैरामीटर द्वारा परिभाषित संभावित मॉडल के स्थान की खोज करता है। यदि पैरामीटर का स्थान बहुत बड़ा है, तो यह प्रशिक्षण डेटा के लिए अत्यधिक अनुकूल है, और एक मॉडल को प्रशिक्षित करता है जो खुद को सामान्य नहीं कर सकता है। यदि आपको इसके बारे में विस्तार से समझाने की आवश्यकता है, तो अधिक गणितीय गणना की आवश्यकता है, और आपको इसे एक नियम के रूप में लेना चाहिए, अपने मॉडल को यथासंभव सरल बनाएं।
कहावत यह है कि जब आप कंप्यूटर में कचरा डालते हैं, तो आउटपुट भी एक कचरा डेटा होता है, हालांकि यह वाक्यांश मशीन सीखने से पहले आया था, लेकिन यह वास्तव में मशीन सीखने के अस्तित्व की एक महत्वपूर्ण सीमा है। मशीन सीखने केवल प्रशिक्षण डेटा में मौजूद पैटर्न का पता लगा सकता है। मशीन सीखने के कार्यों (जैसे वर्गीकरण) की निगरानी के लिए, आपको एक मजबूत, सही ढंग से चिह्नित, समृद्ध प्रशिक्षण डेटासेट की आवश्यकता होती है।
oi जैसा कि निधि के स्टॉक विवरण में चेतावनी दी गई है, अतीत का प्रदर्शन भविष्य के परिणामों की गारंटी नहीं देता है. मशीन सीखने को भी एक समान चेतावनी जारी करनी चाहिएः यह केवल प्रशिक्षण डेटा के समान वितरित डेटा पर काम कर सकता है. इसलिए, प्रशिक्षण डेटा और उत्पादन डेटा के बीच विचलन के लिए सतर्क रहना चाहिए और प्रशिक्षण मॉडल को बार-बार दोहराना चाहिए ताकि यह सुनिश्चित हो सके कि यह पुराना नहीं है।
मशीन लर्निंग तकनीक के भ्रम के प्रचार के तहत, आप सोच सकते हैं कि मशीन लर्निंग मुख्य रूप से एल्गोरिदम का चयन और समायोजन करती है; लेकिन वास्तविकता नगण्य हैः आप अपना अधिकांश समय और ऊर्जा डेटा सफाई और विशेषता इंजीनियरिंग पर खर्च करेंगे - मूल विशेषताओं को उन विशेषताओं में परिवर्तित करना जो डेटा संकेतों का बेहतर प्रतिनिधित्व करते हैं।
मशीन लर्निंग को कई क्षेत्रों में अपनाया और विकसित किया जा रहा है, इसलिए डीप लर्निंग को भी बेतहाशा प्रचारित किया जा रहा है। इसके अलावा, डीप लर्निंग ने कुछ कार्यों को स्वचालित करने के लिए प्रेरित किया है जो पारंपरिक रूप से विशेषता इंजीनियरिंग के माध्यम से किए जाते हैं, विशेष रूप से छवि और वीडियो डेटा के लिए। लेकिन डीप लर्निंग कोई चमत्कार नहीं है। कोई भी तैयार नहीं है जिसे आप उपयोग कर सकते हैं, आपको अभी भी डेटा को साफ करने और बदलने के लिए बहुत अधिक प्रयास करने की आवश्यकता है।
एनआरए से माफी मांगें, मशीन सीखने के एल्गोरिदम हत्या नहीं करते हैं, बल्कि हत्यारे हैं। जब मशीन सीखने के सिस्टम में खराबी होती है, तो यह शायद ही कभी मशीन सीखने के एल्गोरिदम के साथ समस्या होती है। अधिक संभावना है कि मानव त्रुटि को प्रशिक्षण डेटा में पेश किया गया है, जिससे विचलन या अन्य सिस्टम त्रुटियां उत्पन्न होती हैं। हमें हमेशा संदेह के साथ रहना चाहिए और सॉफ्टवेयर इंजीनियरिंग के लिए लागू तरीकों से मशीन सीखने का इलाज करना चाहिए।
मशीन लर्निंग के कई अनुप्रयोगों में, आपके द्वारा आज किए गए निर्णय कल एकत्र किए जाने वाले प्रशिक्षण डेटा को प्रभावित करते हैं। एक बार जब मशीन लर्निंग सिस्टम विचलन को मॉडल में शामिल कर लेता है, तो यह नए प्रशिक्षण डेटा का उत्पादन करना जारी रख सकता है, जिसमें विचलन को बढ़ाया गया है। और, कुछ विचलन लोगों के जीवन को बर्बाद कर सकते हैं। कृपया जिम्मेदारी लेंः स्वयं-पूर्ति भविष्यवाणियां न बनाएं।
बहुत से लोगों को ऐसा लगता है कि वे ए.आई. के बारे में अपने विचार को विज्ञान-फाई फिल्मों से प्राप्त करते हैं। हमें विज्ञान-फाई से प्रेरणा लेनी चाहिए, लेकिन हम इतनी मूर्ख नहीं हो सकते कि उपन्यास को वास्तविकता के रूप में गलत समझें। चेतन दुष्ट मानव से लेकर बेहोश विकृत मशीन सीखने के मॉडल तक, बहुत सारी वास्तविकताएं और खतरे हैं जिनकी आपको चिंता करने की आवश्यकता है। इसलिए आपको स्काईनेट और सुपरइंटेलीजेंस के बारे में चिंता करने की आवश्यकता नहीं है।
मशीन लर्निंग के बारे में जो कुछ भी है, वह मेरे द्वारा बताए गए 10 बिंदुओं से कहीं अधिक है। आशा है कि ये परिचयात्मक सामग्री गैर-पेशेवरों के लिए उपयोगी होगी।
वैश्विक कृत्रिम बुद्धिमत्ता के बड़े डेटा ग्राउंड से पुनर्प्रकाशित