समर्थित वेक्टर मशीन (SVM) एक महत्वपूर्ण मशीन सीखने का वर्गीकरणकर्ता है, जो कम आयामी विशेषताओं को उच्च आयामों में प्रक्षेपित करने के लिए गैर-रैखिक परिवर्तनों का कुशलतापूर्वक उपयोग करता है, जो तुलनात्मक रूप से जटिल वर्गीकरण कार्यों (उच्च आयामी प्रहार) को पूरा कर सकता है। SWM एक गणितीय सरलता का उपयोग करता है, जो कि मस्तिष्क के कोडित तंत्र के अनुरूप होता है, जैसा कि हम 2013 के एक प्रकृति पत्र से पढ़ सकते हैं। मशीन सीखने और मस्तिष्क के कामकाज के बारे में समझने के लिए गहरे संबंध का उपयोग करना। मस्तिष्क का अध्ययन करने के लिए मशीन सीखना। पेपर का नामः The importance of mixed selectivity in complex cognitive tasks (by Omri Barak al.)
सबसे पहले हम न्यूरोकोडिंग के बारे में बात करते हैं: जानवर एक संकेत प्राप्त करते हैं और उसके अनुसार कुछ व्यवहार करते हैं, एक बाहरी संकेत को न्यूरोइलेक्ट्रिक संकेत में परिवर्तित करता है, दूसरा न्यूरोइलेक्ट्रिक संकेत को निर्णय संकेत में परिवर्तित करता है, पहली प्रक्रिया को एन्कोडिंग कहा जाता है, दूसरी प्रक्रिया को डिकोडिंग कहा जाता है। और न्यूरोकोडिंग का वास्तविक उद्देश्य निर्णय लेने के लिए बाद में डिकोड करना है। इसलिए, मशीन सीखने की आंखों का उपयोग करके, कोड को समझने का सबसे आसान तरीका एक वर्गीकरणकर्ता है, यहां तक कि एक लॉजिस्टिक मॉडल का एक रैखिक वर्गीकरणकर्ता भी है, जो इनपुट सिग्नल को कुछ विशेषता वर्गीकरणों के अनुसार अलग-अलग व्यवहार करता है। उदाहरण के लिए, एक बाघ को भागते हुए देखना, एक चींटी को खाना देखना।
तो चलिए देखते हैं कि न्यूरोकोडिंग कैसे होती है, सबसे पहले न्यूरोन को मूल रूप से एक आरसी सर्किट के रूप में देखा जा सकता है, जो बाहरी वोल्टेज के आधार पर प्रतिरोध और क्षमता को समायोजित करता है, जब बाहरी संकेत काफी बड़ा होता है, तो यह संचालित होता है, अन्यथा बंद हो जाता है, और एक संकेत को एक निश्चित समय में डिस्चार्ज की गई आवृत्ति द्वारा दर्शाता है। और जब हम कोडिंग के बारे में बात करते हैं, तो अक्सर समय पर एक विखंडन होता है, यह मानते हुए कि एक छोटी सी समय खिड़की में, यह डिस्चार्ज दर अपरिवर्तित होती है, इस प्रकार एक तंत्रिका नेटवर्क इस समय खिड़की में कोशिकाओं के डिस्चार्ज दर को एक साथ रख सकता है। एक एन-आयामी मात्रा, एन एक न्यूरोनल है, यह एन-आयामी मात्रा, जिसे हम एन-आयामी कहते हैं, और इसे कोड गणना कहते हैं, यह जानवरों द्वारा देखी गई छवियों को व्यक्त कर सकता है, या सुनाई गई आवाज़ों को, जो कि तंत्रिका तंत्रिका नेटवर्क के अनुरूप बाहरी संकेतों को उत्तेजना करता है। इस
ग्राफ: अनुदैर्ध्य अक्ष कोशिका है, और अनुदैर्ध्य अक्ष समय है, और यह दिखाता है कि हम न्यूरोलॉजिकल कोड कैसे निकालते हैं।
बेशक N-dimensional vector और neural coding के वास्तविक आयाम अलग होते हैं, तो neural coding के वास्तविक आयाम को कैसे परिभाषित किया जाता है? सबसे पहले, हम इस N-dimensional vector को चिह्नित N-dimensional space में प्रवेश करते हैं, और फिर हम आपको सभी संभव कार्य संयोजन देते हैं, जैसे कि आपको एक हजार चित्र दिखाना। मान लीजिए कि ये चित्र पूरी दुनिया का प्रतिनिधित्व करते हैं, प्रत्येक बार जब हम प्राप्त करते हैं, तो हम इस स्थान पर एक बिंदु के रूप में न्यूरोकोडिंग चिह्नित करते हैं, और अंत में हम वेक्टर एल्गोरिथ्म की सोच का उपयोग करते हैं। हम इस हजार बिंदुओं को बनाने वाले उप-स्थान के आयामों को देखते हैं, अर्थात, न्यूरोप्रोफाइल के वास्तविक आयाम के रूप में चिह्नित करते हैं। मैं मानता हूं कि सभी बिंदु वास्तव में इस N-dimensional space के एक टुकड़े पर हैं, तो यह अभिव्यक्ति एक-आयामी है, जिसके लिए यदि सभी बिंदु उच्च आयामी अंतरिक्ष के एक दो-आयामी पक्ष पर हैं, तो यह दो-आयामी है। विज्ञान ने पाया है कि आमतौर पर उच्च आया
कोड के वास्तविक आयामों के अलावा, हमारे पास एक अवधारणा है जो बाहरी संकेतों के वास्तविक आयाम है, यहां संकेत तंत्रिका नेटवर्क द्वारा व्यक्त किए गए बाहरी संकेतों को संदर्भित करता है, बेशक आप बाहरी संकेतों के सभी विवरणों को दोहराना चाहते हैं। यह एक अनंत समस्या है, लेकिन हमारे वर्गीकरण और निर्णय के आधार पर हमेशा एक महत्वपूर्ण विशेषता होती है, एक घटाने की प्रक्रिया, जो पीसीए के विचार भी है। हम वास्तविक कार्य में महत्वपूर्ण चर को कार्य के वास्तविक आयाम के रूप में देख सकते हैं, जैसे कि यदि आप एक हाथ की गति को नियंत्रित करना चाहते हैं, तो आपको आमतौर पर केवल जोड़ों के घूर्णन के कोण को नियंत्रित करने की आवश्यकता होती है। यदि आप इसे एक शारीरिक गति विज्ञान समस्या के रूप में देखते हैं, तो आयाम 10 से अधिक नहीं होंगे, हम इसे K कहते हैं। यहां तक कि यदि आप चेहरे को अलग करने की समस्या हैं, तो आयाम अभी भी तंत्रिकाओं की संख्या से बहुत कम हैं।
तो वैज्ञानिकों के सामने एक मुख्य सवाल है, क्यों इस समस्या को हल करने के लिए एक कोडिंग आयाम और न्यूरॉन्स की संख्या का उपयोग करना जो वास्तविक समस्याओं की तुलना में बहुत अधिक है?
और कम्प्यूटेशनल न्यूरोसाइंस और मशीन लर्निंग के साथ मिलकर हमें बताता है कि न्यूरोप्रोफाइल की उच्च आयामी विशेषताएं उनके पास मजबूत विश्वविद्यालय सीखने की क्षमताओं का आधार हैं; कोडिंग के उच्च आयाम, सीखने की क्षमताएं अधिक हैं। ध्यान दें कि हम यहां गहराई से नेटवर्किंग के बारे में भी बात नहीं कर रहे हैं। क्यों? हम यहां कहते हैं कि न्यूरोकोडिंग तंत्र एसवीएम के समान सिद्धांतों का उपयोग करता है, जब हम एक निम्न आयामी संकेत को उच्च आयाम में फेंकते हैं, तो हम अधिक वर्गीकरण कर सकते हैं, यहां तक कि एक रैखिक विभाजक के रूप में, आप असंख्य समस्याओं को हल कर सकते हैं, वास्तव में यह कैसे किया जा सकता है? और यह एसवीएम के साथ किस प्रकार मशीन सिद्धांत का समर्थन करता है?
ध्यान दें कि यहां चर्चा की जाने वाली न्यूरोकोडिंग मुख्य रूप से उच्च स्तरीय तंत्रिका केंद्रों के लिए होती है, जैसे कि इस लेख में चर्चा की गई प्रीफ्रंटल कॉर्टेक्स (PFC), क्योंकि निम्न स्तरीय तंत्रिका केंद्रों के लिए कोडिंग नियम वर्गीकरण और निर्णय लेने में बहुत अधिक शामिल नहीं हैं।
पीएफसी का प्रतिनिधित्व करने वाला उच्च मस्तिष्क क्षेत्र
न्यूरोकोडिंग का रहस्य वास्तव में न्यूरोनल की संख्या N, और वास्तविक समस्या के आयाम K के बीच के संबंध से पता चलता है ((ऐसा अंतर 200 गुना तक पहुंच सकता है) । क्यों प्रतीत होता है कि अतिरिक्त संख्या में न्यूरोनल एक गुणात्मक छलांग का कारण बन सकते हैं? सबसे पहले, हम मानते हैं कि जब हमारे एन्कोडिंग आयाम वास्तविक कार्य में महत्वपूर्ण चर के आयाम के बराबर होते हैं, तो हम एक रैखिक वर्गीकरणकर्ता का उपयोग करते हैं जो गैर-रैखिक वर्गीकरण समस्या को संभाल नहीं सकता है (मान लें कि आप मेथी से मेथी को अलग करने जा रहे हैं, आप मेथी को मेथी से एक रैखिक सीमा के साथ नहीं निकाल सकते हैं), जो कि एक विशिष्ट समस्या है जिसे हम गहन सीखने और एसवीएम में हल करने में मुश्किल है जब हम मशीन सीखने में प्रवेश नहीं करते हैं।
SVM ((वेक्टर मशीन का समर्थन करता है):
एसवीएम में गैर-रैखिक वर्गीकरण किया जा सकता है, उदाहरण के लिए, चित्र में लाल और नीले बिंदुओं को अलग करना, और रैखिक सीमाओं के साथ हम लाल और नीले बिंदुओं को अलग नहीं कर सकते हैं ((बाएं चित्र), इसलिए एसवीएम का उपयोग करने का तरीका उच्च आयाम है। लेकिन केवल चर की संख्या में वृद्धि करना असंभव है, जैसे कि x1, x2 को x1, x2, x1 + x2 सिस्टम में मैप करना, जो वास्तव में दो आयामी रैखिक स्थान है ((चित्र में लाल बिंदु और नीले बिंदु एक विमान पर हैं), केवल गैर-रैखिक फ़ंक्शन का उपयोग करना है ((x1 ^ 2, x1 * x2, x2 ^ 2) हमारे पास वास्तविक निम्न आयाम से उच्च आयाम तक का क्रॉस है, इस समय आप नीले बिंदु को हवा में फेंक देते हैं, और फिर आप बस एक बिंदु को अंतरिक्ष में चित्रित करते हैं, और नीले और लाल के बीच एक बिंदु को विभाजित करते हैं।
वास्तव में, वास्तविक तंत्रिका नेटवर्क कुछ इसी तरह का काम करता है. इस प्रकार, एक रैखिक वर्गीकरणकर्ता (डिकोडर) द्वारा किए जा सकने वाले वर्गीकरणों की संख्या में काफी वृद्धि हुई है, जिसका अर्थ है कि हमें पहले की तुलना में बहुत अधिक मजबूत पैटर्न पहचानने की क्षमता मिली है. यहाँ, उच्च आयाम उच्च शक्ति है, उच्च आयाम का हमला सच है।
तो, उच्च आयामों में न्यूरॉन्स को कैसे एन्कोड किया जाता है? अधिक संख्या में न्यूरॉन्स का कोई उपयोग नहीं होता है. क्योंकि हमने रैखिक बीजगणित सीखा है, हम जानते हैं कि यदि हमारे पास बड़ी संख्या में एन न्यूरॉन्स हैं, और प्रत्येक न्यूरॉन्स की डिस्चार्ज दर केवल एक प्रमुख विशेषता के साथ रैखिक रूप से जुड़ी हुई है, तो हमारे अंतिम वर्णक आयाम केवल समस्या के स्वयं के आयाम के बराबर हैं, आपके एन न्यूरॉन्स का कोई काम नहीं है. यदि आप इसे तोड़ना चाहते हैं, तो आपको K विशेषता के साथ गैर-रैखिक रूप से जुड़े न्यूरॉन्स होने चाहिए, जिसे हम गैर-रैखिक मिश्रित न्यूरॉन्स कहते हैं, जो बहुत जटिल है और एसवीएम में गैर-रैखिक न्यूरॉन्स के साथ समान है।
चित्रः न्यूरॉन्स 1 और 2 केवल लक्षण a और b के प्रति संवेदनशील हैं, 3 लक्षण a और b के रैखिक मिश्रण के प्रति संवेदनशील हैं, और 4 लक्षण के गैर-रैखिक मिश्रण के प्रति संवेदनशील हैं। अंत में, केवल 1, 2, 4 के संयोजन ने तंत्रिका कोडिंग आयाम को बढ़ा दिया है।
इस प्रकार के एन्कोडिंग का आधिकारिक नाम मिश्रित चयन है, और जब तक इस प्रकार के एन्कोडिंग के सिद्धांतों की खोज नहीं की जाती है, तब तक यह समझ में नहीं आता है, क्योंकि यह एक तंत्रिका नेटवर्क है जो किसी संकेत के प्रति प्रतिक्रिया करता है। आसपास के तंत्रिका तंत्र में, तंत्रिकाओं की भूमिका सेंसर की तरह होती है, जो संकेतों की विभिन्न विशेषताओं को निकालने और पैटर्न की पहचान करने के लिए होती है। प्रत्येक तंत्रिका का कार्य काफी विशिष्ट होता है, जैसे कि रेटिना के रॉड और शंकु, जो कि फोटोन प्राप्त करने के लिए जिम्मेदार होते हैं, और फिर मूल गैंगेलियन सेल द्वारा एन्कोडिंग जारी रखते हैं, प्रत्येक तंत्रिका एक पेशेवर प्रशिक्षित चौकीदार की तरह होती है। जबकि उन्नत मस्तिष्क में, स्पष्ट विभाजन अभी भी मुश्किल है, हम एक ही तंत्रिका तंत्रिका के लिए एक विशिष्ट विशेषता के प्रति संवेदनशील होने की संभावना है, यदि हम कल्पना करते हैं कि यह उच्च संवेदनशीलता है। वे विभिन्न कार्यों के लिए अधिक कठिन नहीं हैं।
प्रकृति के हर विवरण में अंतर्निहित कल्पनाएं, भारी मात्रा में अतिरेक और मिश्रित कोडिंग, जो कि एक असभ्य व्यवहार की तरह दिखता है, एक भ्रमित संकेत के रूप में, अंततः बेहतर गणना क्षमता प्राप्त करता है। इस सिद्धांत के साथ, हम आसानी से इस तरह के कार्यों को संभाल सकते हैंः
इस कार्य में, मकड़ी को पहले यह समझने के लिए प्रशिक्षित किया जाता है कि क्या एक छवि पहले की तरह ही है (पहचान) और फिर दो अलग-अलग छवियों के आने के क्रम (याद) का निर्धारण करने के लिए प्रशिक्षित किया जाता है। इस तरह के कार्यों को पूरा करने के लिए मकड़ी को कार्य के विभिन्न पक्षों को कोड करने में सक्षम होना चाहिए, जैसे कि कार्य प्रकार (याद या पहचान), छवि प्रकार आदि, और यह एक उत्कृष्ट परीक्षण है कि क्या मिश्रित गैर-रैखिक कोडिंग तंत्र है। प्रयोगों से पता चला है कि बहुत सारे तंत्रिकाएं मिश्रित विशेषताओं के प्रति संवेदनशील हैं, और गैर-रैखिक (जैसे कि फूलों कोडिंग के लिए भी, तंत्रिकाओं की रिहाई की तीव्रता इस पर निर्भर करती है कि कार्य याद या पहचान है, विशेषताओं के बीच स्वतंत्र नहीं है) । मिश्रित कोडिंग ने तंत्रिकाओं को उच्च आयामी विशेषताएं प्रदान कीं, जिससे इन कार्यों के कई पक्षों को शामिल किया जा सके।
इस लेख को पढ़ने के बाद, हम समझते हैं कि तंत्रिका नेटवर्क को डिजाइन करने में कुछ गैर-रैखिक इकाइयों को शामिल करने से पैटर्न पहचान क्षमता में काफी सुधार होता है, और एसवीएम ने इसे गैर-रैखिक वर्गीकरण समस्याओं को हल करने के लिए लागू किया है। जबकि कम्प्यूटेशनल तंत्रिका विज्ञान और मशीन लर्निंग एक सिक्के के दो पक्ष हैं।
हम मस्तिष्क के क्षेत्रों के कामकाज का अध्ययन करते हैं, पहले मशीन सीखने के तरीकों से डेटा को संसाधित करते हैं, जैसे कि पीसीए के साथ समस्याओं के महत्वपूर्ण आयामों को खोजना, फिर मशीन सीखने के पैटर्न की पहचान करने वाले विचारों के साथ तंत्रिका कोडिंग और कोडिंग को समझना, और अंत में अगर हमें कुछ नई प्रेरणा मिलती है, तो हम मशीन सीखने के तरीकों को भी बेहतर बना सकते हैं। मस्तिष्क या मशीन सीखने के एल्गोरिदम के लिए, अंततः सबसे महत्वपूर्ण जानकारी प्राप्त करने के लिए सबसे उपयुक्त प्रतिनिधित्व का तरीका है, और अच्छी विशेषता के साथ, कुछ भी करना आसान है। यही कारण है कि मशीन सीखना रैखिक तर्क से वापस आ रहा है जो एक-चरण में मशीन सीखने के लिए समर्थन करता है। प्रगतिशील विकास की प्रक्रिया, या शायद यह भी मस्तिष्क विकसित हो रहा है, हम दुनिया को नियंत्रित करने की हमारी क्षमता को बढ़ा रहे हैं। या शायद यह स्पष्ट है कि इसका उद्देश्य क्या था कि कौन शेर है और कौन भेड़ है, जो सो सकता है, लेकिन इस प्रक्रिया में दुनिया के बारे में गहराई से समझ विकसित हो रही है, और खुद को धीरे-धीरे समझना।
अनुवादःशौच लोहा-क्रूजर प्रौद्योगिकी