সাপোর্ট ভেক্টর মেশিন (SVM) একটি গুরুত্বপূর্ণ মেশিন লার্নিং শ্রেণীবিভাজক, যা দক্ষতার সাথে অ-রৈখিক রূপান্তর ব্যবহার করে নিম্ন মাত্রার বৈশিষ্ট্যগুলিকে উচ্চ মাত্রায় প্রজেক্ট করে, যা তুলনামূলকভাবে জটিল শ্রেণিবদ্ধকরণ কাজগুলি সম্পাদন করতে পারে (উচ্চতর মাত্রার আঘাত) । SWM একটি গাণিতিক কৌশল ব্যবহার করে বলে মনে হয়, যা আসলে মস্তিষ্কের কোডিংয়ের প্রক্রিয়াটির সাথে সামঞ্জস্যপূর্ণ, যা আমরা 2013 সালে একটি প্রকৃতি পত্র থেকে পড়তে পারি যে মেশিন লার্নিং এবং মস্তিষ্কের কাজ সম্পর্কে গভীর সংযোগগুলি বোঝার জন্য উপরের সংযোগটি মেশিন লার্নিং গবেষণা মস্তিষ্ক ব্যবহার করে। প্রবন্ধের নামঃ The importance of mixed selectivity in complex cognitive tasks (by Omri Barak al. )
এই বিস্ময়কর সংযোগগুলি কোথায় দেখা যায়? প্রথমে আসুন আমরা নিউরোকোডিংয়ের প্রকৃতি সম্পর্কে কথা বলিঃ প্রাণীগুলি একটি নির্দিষ্ট সংকেত গ্রহণ করে এবং তার উপর ভিত্তি করে নির্দিষ্ট আচরণ করে, একটি বাহ্যিক সংকেতকে নিউরো ইলেকট্রিক সংকেতগুলিতে রূপান্তর করে, অন্যটি নিউরো ইলেকট্রিক সংকেতগুলিকে সিদ্ধান্তের সংকেতগুলিতে রূপান্তর করে, প্রথম প্রক্রিয়াটি এনকোডিং নামে পরিচিত, দ্বিতীয় প্রক্রিয়াটি ডিকোডিং নামে পরিচিত। এবং নিউরোকোডিংয়ের আসল উদ্দেশ্যটি হ'ল পরে সিদ্ধান্ত নেওয়ার জন্য ডিকোডিং। সুতরাং, মেশিন লার্নিংয়ের দৃষ্টিভঙ্গি দিয়ে কোডিংয়ের সহজতম উপায় হ'ল একটি শ্রেণিবদ্ধকরণকারী, এমনকি লজিস্টিক মডেলের একটি রৈখিক শ্রেণিবদ্ধকরণকারী, যা ইনপুট সংকেতগুলিকে নির্দিষ্ট বৈশিষ্ট্যগত শ্রেণিবদ্ধকরণের ভিত্তিতে পৃথকভাবে আচরণ করে। উদাহরণস্বরূপ, বাঘ পালিয়ে যাওয়া দেখতে, মশাটি খেয়ে ফেলা দেখতে। অবশ্যই, মেশিনগুলি কখনও কখনও নিউ
তাহলে আসুন দেখি কিভাবে নিউরন কোডিং হয়, প্রথমে নিউরনকে মূলত একটি আরসি সার্কিটের মত দেখা যায়, যেটি বাহ্যিক ভোল্টেজের উপর নির্ভর করে রেসিস্ট্যান্স এবং ক্যাপাসিটি সামঞ্জস্য করে, যখন বাহ্যিক সংকেত যথেষ্ট বড় হয়, তখন এটি পরিচালিত হয়, অন্যথায় এটি বন্ধ হয়ে যায় এবং নির্দিষ্ট সময়ের মধ্যে বিদ্যুৎ সরবরাহের ফ্রিকোয়েন্সি দ্বারা একটি সংকেত চিহ্নিত করে। এবং আমরা যখন কোডিং সম্পর্কে কথা বলি, তখন আমরা প্রায়শই সময়কে বিচ্ছিন্নভাবে পরিচালনা করি, মনে করি যে একটি ছোট সময়ের উইন্ডোতে, এই ছাড়ের হারটি অপরিবর্তনীয়, যাতে একটি নিউরাল নেটওয়ার্ক এই সময়ের উইন্ডোতে কোষের মুক্তির হার একসাথে একটি এন-মাত্রার পরিমাণ তৈরি করতে পারে, এন হল নিউরনের একক, এই এন-মাত্রার সংখ্যাটি, আমরা এটিকে কোডিং নামকরণ করি, এটি প্রাণীর দৃষ্টিভঙ্গির চিত্র প্রকাশ করতে পারে, বা শোনার শব্দগুলি, যা নিউরাল কর্পটের নেটওয়ার্কের অনুরূপ বহিরাগত-প্রকাশের অনুরূপ সিগন্যালগুলি উত্থা
গ্রাফঃ লম্ব অক্ষ হল কোষ, এবং অনুভূমিক অক্ষ হল সময়, এবং গ্রাফটি দেখায় কিভাবে আমরা নিউরাল কোডিং বের করি।
অবশ্যই N-dimensional ভেক্টর এবং নিউরো-কোডিং এর প্রকৃত মাত্রা ভিন্ন, কিভাবে নিউরো-কোডিং এর প্রকৃত মাত্রা সংজ্ঞায়িত করা যায়? প্রথমে, আমরা এই N-dimensional ভেক্টর দ্বারা চিহ্নিত N-dimensional space-এ প্রবেশ করি, তারপর আমরা আপনাকে সমস্ত সম্ভাব্য মিশ্রণ প্রদান করি, যেমন আপনাকে এক হাজার ছবি দেখাতে পারি যদি আমরা অনুমান করি যে এই ছবিগুলি পুরো বিশ্বকে প্রতিনিধিত্ব করে, আমরা যখনই আমাদের কাছে নিউরো-কোডিং পাই তখন এটিকে এই স্পেসের একটি বিন্দু হিসাবে চিহ্নিত করি, এবং অবশেষে আমরা ভেক্টর অ্যালগরিদমের চিন্তাভাবনা ব্যবহার করে এই হাজারটি বিন্দু তৈরি করে এমন সাবস্পেসের মাত্রা দেখি, যা নিউরো-প্রতিনিধিত্বের প্রকৃত মাত্রা হিসাবে চিহ্নিত করা হয়। আমি অনুমান করি যে সমস্ত বিন্দু আসলে এই N-dimensional space-এর একটি অংশে রয়েছে, তাহলে এই উপস্থাপনাটি এক-মাত্রিক, যার অর্থ যদি সমস্ত বিন্দু উচ্চ-মাত্রার স্পেসের একটি দ্বি-মাত্রিক পৃষ্ঠায় থাকে, তাহলে এটি দ্বি-মাত্রিক। বিজ্ঞান আবিষ্কার
কোডিংয়ের প্রকৃত মাত্রা ছাড়াও, আমাদের কাছে একটি ধারণা রয়েছে যা হল বাহ্যিক সংকেতগুলির প্রকৃত মাত্রা, এখানে সংকেতগুলি নিউরাল নেটওয়ার্কের দ্বারা প্রকাশিত বাহ্যিক সংকেতগুলিকে বোঝায়, অবশ্যই আপনি বাহ্যিক সংকেতগুলির সমস্ত বিবরণ পুনরাবৃত্তি করতে চান। এটি একটি অসীম সমস্যা, তবে আমাদের শ্রেণিবদ্ধকরণ এবং সিদ্ধান্ত গ্রহণের ভিত্তি সর্বদা মূল বৈশিষ্ট্যগুলির উপর ভিত্তি করে, এটি একটি ডিমেনশনালাইজেশন প্রক্রিয়া, যা এখানে পিসিএর ধারণাও। আমরা বাস্তব কাজে মূল পরিবর্তনশীলগুলিকে কাজের প্রকৃত মাত্রা হিসাবে বিবেচনা করতে পারি, যেমন আপনি যদি একটি বাহুর গতি নিয়ন্ত্রণ করতে চান তবে আপনাকে সাধারণত জয়েন্টগুলির ঘূর্ণন কোণটি নিয়ন্ত্রণ করতে হবে। যদি আপনি এটিকে কেবল একটি শারীরবৃত্তীয় সমস্যা হিসাবে দেখেন তবে মাত্রা 10 এর চেয়ে বেশি হবে না, আমরা এটিকে কে বলি। এমনকি আপনি যদি মুখ সনাক্তকরণ সমস্যাটি করেন তবে মাত্রাটি এখনও স্নায়ুর সংখ্যার চেয়ে অনেক কম।
তাহলে বিজ্ঞানীরা একটি মূল প্রশ্নের মুখোমুখি হচ্ছেন, কেন এই সমস্যার সমাধান করতে হবে কোডিংয়ের মাত্রা এবং নিউরন সংখ্যা যা আসল সমস্যার তুলনায় অনেক বেশি?
কম্পিউটিং নিউরোলজি এবং মেশিন লার্নিং একসাথে আমাদের বলে যে, নিউরোলজিকাল রেফারেন্সের উচ্চ মাত্রিক বৈশিষ্ট্যগুলি তাদের শক্তিশালী শিক্ষার দক্ষতার ভিত্তি। কোডিংয়ের উচ্চ মাত্রা, শেখার ক্ষমতা। লক্ষ্য করুন, আমরা এখানে গভীর নেটওয়ার্কগুলির সাথেও জড়িত নই। কেন? আমরা এখানে বলছি যে স্নায়ু কোডিংয়ের প্রক্রিয়াটি এসভিএম-এর অনুরূপ নীতিগুলি ব্যবহার করে, যখন আমরা একটি নিম্ন মাত্রিক সংকেতকে উচ্চ মাত্রায় প্রেরণ করি, আমরা আরও বেশি শ্রেণিবদ্ধ করতে পারি, এমনকি একটি রৈখিক বিভাজক হিসাবেও আপনি অসংখ্য সমস্যা সমাধান করতে পারেন। এটি কীভাবে সম্ভব? এটি কীভাবে এসভিএম-এর সাথে সামঞ্জস্যপূর্ণ?
মনে রাখবেন যে এখানে আলোচনা করা নিউরোকোডিং মূলত উচ্চতর স্নায়ু কেন্দ্রের নিউরোকোডিংকে বোঝায়, যেমন প্রাক-ফ্রন্টাল কর্টেক্স (PFC) যা এই নিবন্ধে আলোচনা করা হয়েছে, কারণ নিম্ন স্তরের স্নায়ু কেন্দ্রের কোডিং নিয়মগুলি শ্রেণিবদ্ধকরণ এবং সিদ্ধান্ত গ্রহণের সাথে খুব বেশি জড়িত নয়।
পিএফসির প্রতিনিধিত্বকারী উচ্চতর মস্তিষ্কের অঞ্চল
প্রথমত, আমরা অনুমান করি যে যখন আমাদের এনকোডিং মাত্রা সত্যিকারের কাজে গুরুত্বপূর্ণ ভেরিয়েবলের মাত্রার সমান হয়, তখন আমরা একটি রৈখিক শ্রেণীবিভাজক ব্যবহার করি যা অ-রৈখিক শ্রেণীবিভাজন সমস্যাগুলি পরিচালনা করতে সক্ষম হবে না (আমাদের মনে হয় আপনি ডালপালা থেকে ডালপালা আলাদা করতে চান, আপনি ডালপালা থেকে ডালপালা সরিয়ে ফেলতে পারেন না) যা আমরা গভীর শেখার এবং এসভিএম-তে মেশিন লার্নিং-এ প্রবেশ না করার সময়ও সমাধান করতে পারি না। এটি একটি আদর্শ সমস্যা। এসভিএম-এর সাথে ক্লাসিক সমস্যার মূল সূত্রগুলি পুনরায় বর্ণনা করা হয়, যেমন আমাদের মূল স্থানাঙ্কগুলি থেকে একটি নতুন উচ্চতর মাত্রার স্থানাঙ্ক মোডে পরিবর্তন করা হয়।
SVM (ভেক্টর মেশিন সমর্থন করে):
এসভিএম অ-রৈখিক শ্রেণীবিভাগ করতে পারে, যেমন গ্রাফের লাল এবং নীল বিন্দুগুলি আলাদা করা, রৈখিক সীমানা দিয়ে আমরা লাল এবং নীল বিন্দুগুলি আলাদা করতে পারি না ((বাম চিত্র), তাই এসভিএম ব্যবহার করার উপায় হ'ল উচ্চ মাত্রা বৃদ্ধি করা। এবং কেবলমাত্র ভেরিয়েবলের সংখ্যা বাড়ানো কার্যকর নয়, যেমন x1, x2 এর সাথে একটি x1, x2, x1 + x2 সিস্টেমকে ম্যাপ করা যা আসলে একটি দ্বি-মাত্রিক রৈখিক স্থান (গ্রাফটি যদি লাল এবং নীল বিন্দুগুলি একটি সমতলে থাকে তবে চিত্রিত হয়), কেবলমাত্র অ-রৈখিক ফাংশনগুলি ব্যবহার করে ((x1 ^ 2, x1 * x2, x2 ^ 2) আমরা উচ্চ মাত্রার মধ্যে একটি বাস্তব নিম্ন মাত্রা অতিক্রম করি, যখন আপনি নীল বিন্দুগুলিকে আকাশে ফেলে দেন, এবং তারপরে আপনি কেবল একটি বিন্দু অঙ্কন করেন, নীল এবং লাল সমতলগুলিকে পৃথক করে, এবং তারপর একটি গ্রাফ খুলুন।
প্রকৃতপক্ষে, বাস্তব নিউরাল নেটওয়ার্কগুলি ঠিক একই কাজ করে। এইভাবে, একটি রৈখিক শ্রেণিবদ্ধকারী (ডিকোডার) দ্বারা পরিচালিত শ্রেণিবদ্ধকরণের ধরণ ব্যাপকভাবে বৃদ্ধি পেয়েছে, অর্থাৎ আমরা আগের তুলনায় অনেক বেশি শক্তিশালী প্যাটার্ন সনাক্তকরণ ক্ষমতা পেয়েছি। এখানে, উচ্চ মাত্রা উচ্চ ক্ষমতা, উচ্চ মাত্রা আঘাত সত্য।
তাহলে, কিভাবে উচ্চ মাত্রার নিউরন কোডিং পাওয়া যায়? আলোক নিউরন সংখ্যা বেশি হলে কোন উপকার হয় না. কারণ আমরা রৈখিক বীজগণিত শিখেছি, আমরা জানি যে, যদি আমাদের প্রচুর সংখ্যক N টি নিউরন থাকে এবং প্রতিটি নিউরনের স্রাবের হার কেবলমাত্র K টি মূল বৈশিষ্ট্যগুলির সাথে রৈখিকভাবে সম্পর্কিত হয়, তবে আমাদের শেষ বর্ণনার মাত্রা কেবল সমস্যার মাত্রার সমান হবে, আপনার N টি নিউরন কোনও কাজ করে না। যদি আপনি এটিকে অতিক্রম করতে চান তবে আপনার K টি বৈশিষ্ট্যগুলির সাথে অ-রৈখিকভাবে সম্পর্কিত নিউরন থাকতে হবে। এখানে আমরা এটিকে অ-রৈখিকভাবে মিশ্রিত নিউরন বলি। এই ধরণের নিউরনগুলির বর্ণনা খুব জটিল এবং এর নীতিগুলি এসভিএম-এর অ-রৈখিক ফাংশনগুলির মতো।
চিত্রঃ নিউরন ১ এবং ২ শুধুমাত্র বৈশিষ্ট্য a এবং b এর প্রতি সংবেদনশীল, ৩ শুধুমাত্র বৈশিষ্ট্য a এবং b এর রৈখিক মিশ্রণের প্রতি সংবেদনশীল, এবং ৪ শুধুমাত্র বৈশিষ্ট্যগুলির অ-রৈখিক মিশ্রণের প্রতি সংবেদনশীল। শেষ পর্যন্ত মাত্র ১, ২, ৪ টি নিউরনের সমন্বয় নিউরন কোডিংয়ের মাত্রা বৃদ্ধি করে।
এই কোডিং এর অফিসিয়াল নাম হল মিশ্র নির্বাচনী, এবং এই কোডিং এর নীতি আবিষ্কৃত না হওয়া পর্যন্ত আমরা এটিকে অজানা মনে করি, কারণ এটি একটি নিউরাল নেটওয়ার্ক যা একটি নির্দিষ্ট সংকেতকে প্রতিক্রিয়া দেখায়। পার্শ্ববর্তী স্নায়ুতন্ত্রের মধ্যে, নিউরনগুলি বিভিন্ন বৈশিষ্ট্য এবং প্যাটার্নগুলি সনাক্ত করার জন্য সংকেতগুলির বিভিন্ন বৈশিষ্ট্যগুলি বের করার জন্য সেন্সরগুলির মতো কাজ করে। প্রতিটি নিউরন কোষের কার্যকারিতা বেশ নির্দিষ্ট, যেমন রেটিনের রড এবং শঙ্কুগুলি ফোটন গ্রহণের জন্য দায়ী, এবং তারপরে গ্যাঞ্জিলিয়ন কোষ দ্বারা কোডিং চালিয়ে যায়, প্রতিটি নিউরন যেমন একটি পেশাদার প্রশিক্ষিত রক্ষী।
প্রকৃতির প্রতিটি বিবরণেই লুকিয়ে আছে কল্পনাপ্রসূততা, প্রচুর পরিমাণে পুনরাবৃত্তি এবং মিশ্রিত কোডিং। এই অপ্রত্যাশিত পদ্ধতিগুলি, যা মনে হয় বিশৃঙ্খল সংকেতগুলি, শেষ পর্যন্ত আরও ভাল গণনার ক্ষমতা অর্জন করে। এই নীতির সাথে, আমরা সহজেই এই জাতীয় কিছু কাজ করতে পারিঃ
এই কাজটি করার জন্য, মুনকে প্রথমে একটি চিত্রকে পূর্ববর্তীটির সাথে একই কিনা তা সনাক্ত করতে (recognition) এবং তারপরে দুটি ভিন্ন চিত্রের উপস্থিতির ক্রম (recall) বিচার করতে প্রশিক্ষণ দেওয়া হয়। এই কাজটি সম্পন্ন করার জন্য মুনকে বিভিন্ন দিকের কোডিং করতে হবে, যেমন টাস্কের ধরন (recall or recognition), চিত্রের ধরন ইত্যাদি, এবং এটি একটি দুর্দান্ত পরীক্ষা যা মিশ্রিত অ-রৈখিক কোডিং পদ্ধতির পরীক্ষা করে। পরীক্ষাগুলি প্রমাণ করে যে প্রচুর সংখ্যক স্নায়ু মিশ্রিত বৈশিষ্ট্যগুলির জন্য সংবেদনশীল এবং অ-রৈখিক (যেমন ফুলের কোডিং, যা স্নায়ু কোডিংয়ের উপর নির্ভর করে, বৈশিষ্ট্যগুলির মধ্যে স্বাধীন নয়) । মিশ্রিত কোডিং নিউরনকে উচ্চ-মাত্রিক বৈশিষ্ট্যযুক্ত করে তোলে, যার ফলে এই বিভিন্ন দিকের কাজগুলি অন্তর্ভুক্ত করা হয়। কোডগুলি সমাধান এবং হ্যান্ডলিংয়ের জন্য উপযুক্ত।
এই নিবন্ধটি পড়ার পর, আমরা বুঝতে পেরেছি যে নকশা নিউরাল নেটওয়ার্কগুলি যদি কিছু অ-রৈখিক ইউনিটগুলি প্রবর্তন করে তবে এটি প্যাটার্ন সনাক্তকরণের ক্ষমতাকে ব্যাপকভাবে উন্নত করে এবং এসভিএম ঠিক এটি ব্যবহার করে অ-রৈখিক শ্রেণিবদ্ধকরণ সমস্যাটি সমাধান করে।
আমরা মস্তিষ্কের অংশগুলির কার্যকারিতা অধ্যয়ন করি, প্রথমে মেশিন লার্নিংয়ের পদ্ধতিতে ডেটা প্রক্রিয়াকরণ করি, যেমন পিসিএ দিয়ে সমস্যার মূল মাত্রা সন্ধান করা, তারপরে মেশিন লার্নিংয়ের মডেল সনাক্তকরণের চিন্তাভাবনা দিয়ে নিউরাল কোডিং এবং ডিকোডিং বোঝার জন্য, এবং শেষ পর্যন্ত যদি আমরা কিছু নতুন অনুপ্রেরণা পাই তবে আমরা মেশিন লার্নিংয়ের পদ্ধতিটি আরও উন্নত করতে পারি। মস্তিষ্ক বা মেশিন লার্নিং অ্যালগরিদমগুলির জন্য, শেষ পর্যন্ত সবচেয়ে গুরুত্বপূর্ণ বিষয় হ'ল তথ্য পাওয়ার সবচেয়ে উপযুক্ত উপস্থাপনের পদ্ধতি, এবং ভাল উপস্থাপনের সাথে, সবকিছু সহজ হয়ে যায়। এটি মেশিন লার্নিংয়ের রৈখিক যুক্তি থেকে ফিরে আসা যা একটি ধাপে ধাপে মেশিন লার্নিংকে সমর্থন করে।
এই ভিডিওটি ট্রান্সলেট করা হয়েছে।