মেশিন লার্নিং কি?
মেশিনগুলি প্রচুর পরিমাণে ডেটা বিশ্লেষণ করে শিখতে পারে। উদাহরণস্বরূপ, বিড়াল বা মানুষের মুখ সনাক্ত করার জন্য প্রোগ্রামিংয়ের প্রয়োজন হয় না, তারা চিত্র ব্যবহার করে প্রশিক্ষণ পেতে পারে, যাতে তারা নির্দিষ্ট লক্ষ্যগুলিকে সংকলন এবং সনাক্ত করতে পারে।
মেশিন লার্নিং এবং কৃত্রিম বুদ্ধিমত্তার সম্পর্ক
মেশিন লার্নিং এমন একটি বিষয় যা তথ্যের মধ্যে মডেলগুলি খুঁজে বের করে এবং এই মডেলগুলি ব্যবহার করে ভবিষ্যদ্বাণীমূলক গবেষণা এবং অ্যালগরিদম তৈরি করে। মেশিন লার্নিং কৃত্রিম বুদ্ধিমত্তার একটি অংশ এবং জ্ঞান আবিষ্কার এবং ডেটা মাইনিংয়ের সাথে সংযুক্ত।
মেশিন লার্নিং কিভাবে কাজ করে
1 তথ্য নির্বাচন করুন: আপনার তথ্যকে তিনটি দলে ভাগ করুনঃ প্রশিক্ষণ তথ্য, যাচাইকরণ তথ্য এবং পরীক্ষার তথ্য ২ মডেল ডেটাঃ প্রশিক্ষণ ডেটা ব্যবহার করে সম্পর্কিত বৈশিষ্ট্যগুলি ব্যবহার করে মডেল তৈরি করা ৩. ভ্যালিডেশন মডেলঃ আপনার ভ্যালিডেশন ডেটা ব্যবহার করে আপনার মডেল অ্যাক্সেস করুন ৪ টেস্ট মডেলঃ আপনার টেস্ট ডেটা ব্যবহার করে যাচাইকৃত মডেলের পারফরম্যান্স পরীক্ষা করুন ৫. মডেল ব্যবহারঃ সম্পূর্ণ প্রশিক্ষিত মডেল ব্যবহার করে নতুন তথ্যের উপর ভবিষ্যদ্বাণী করা ৬. অপ্টিমাইজেশান মডেলঃ অ্যালগরিদমের পারফরম্যান্স বাড়ানোর জন্য আরও ডেটা, বিভিন্ন বৈশিষ্ট্য বা সংশোধিত প্যারামিটার ব্যবহার করা হয়
মেশিন লার্নিং এর অবস্থান
1 প্রচলিত প্রোগ্রামিং: সফটওয়্যার ইঞ্জিনিয়াররা সমস্যা সমাধানের জন্য প্রোগ্রাম লেখেন। প্রথমে কিছু তথ্য থাকে→ একটি সমস্যা সমাধানের জন্য, সফটওয়্যার ইঞ্জিনিয়াররা একটি প্রক্রিয়া লিখে মেশিনকে বলে যে এটি কীভাবে করা উচিত→ কম্পিউটার এই প্রক্রিয়াটি অনুসরণ করে এবং তারপরে ফলাফল দেয় ২ পরিসংখ্যানঃ বিশ্লেষকরা ভেরিয়েবলের মধ্যে সম্পর্ক তুলনা করে ৩. মেশিন লার্নিংঃ ডেটা সায়েন্টিস্টরা প্রশিক্ষিত ডেটাসেট ব্যবহার করে কম্পিউটারকে শেখায় যে কম্পিউটারটি কী করা উচিত, এবং তারপরে সিস্টেমটি সেই কাজটি করে। প্রথমত, বড় ডেটা রয়েছে→ মেশিনগুলি প্রশিক্ষিত ডেটাসেট ব্যবহার করে শ্রেণিবিন্যাস করতে শিখবে, লক্ষ্য শ্রেণিবিন্যাস বাস্তবায়নের জন্য নির্দিষ্ট অ্যালগরিদমগুলি নিয়ন্ত্রণ করবে→ এই কম্পিউটারটি ডেটাতে সম্পর্ক, প্রবণতা এবং নিদর্শনগুলি সনাক্ত করতে শিখবে 4 স্মার্ট অ্যাপ্লিকেশনঃ স্মার্ট অ্যাপ্লিকেশন ব্যবহার করে কৃত্রিম বুদ্ধিমত্তা দ্বারা প্রাপ্ত ফলাফল, চিত্রটি একটি যথার্থ কৃষি অ্যাপ্লিকেশন কেস, যা ড্রোন দ্বারা সংগৃহীত ডেটা ভিত্তিক
মেশিন লার্নিং এর ব্যবহারিক প্রয়োগ
মেশিন লার্নিং এর অনেকগুলো অ্যাপ্লিকেশন রয়েছে, এখানে কিছু উদাহরণ দেওয়া হল, আপনি কিভাবে এটি ব্যবহার করবেন?
দ্রুত 3D ম্যাপিং এবং মডেলিংঃ একটি রেলওয়ে সেতু নির্মাণের জন্য, পিডাব্লুসির ডেটা বিজ্ঞানী এবং ক্ষেত্রের বিশেষজ্ঞরা ড্রোন দ্বারা সংগৃহীত ডেটাতে মেশিন লার্নিং প্রয়োগ করেছেন। এই সংমিশ্রণটি কাজের সাফল্যের ক্ষেত্রে সুনির্দিষ্ট পর্যবেক্ষণ এবং দ্রুত প্রতিক্রিয়া প্রদান করে।
ঝুঁকি কমানোর জন্য শক্তিশালী বিশ্লেষণঃ অভ্যন্তরীণ লেনদেন সনাক্ত করার জন্য, পিডব্লিউসি মেশিন লার্নিং এবং অন্যান্য বিশ্লেষণ প্রযুক্তির সাথে মিলিত হয়েছে, যার ফলে ব্যবহারকারীর আরও সম্পূর্ণ প্রোফাইল তৈরি হয়েছে এবং জটিল সন্দেহজনক আচরণের আরও গভীর ধারণা পাওয়া গেছে।
সর্বোত্তম পারফরম্যান্সের পূর্বাভাসের লক্ষ্যঃ মেশিন লার্নিং এবং অন্যান্য বিশ্লেষণ পদ্ধতি ব্যবহার করে পিডব্লিউসি মেলবোর্ন কাপের বিভিন্ন ঘোড়ার সম্ভাব্যতা মূল্যায়ন করে।
কয়েক দশক ধরে, এআই গবেষকদের বিভিন্ন ‘গোষ্ঠী’ একে অপরের সাথে একত্রে লড়াই করে চলেছে। এখন কি এই গোষ্ঠীগুলির একত্রিত হওয়ার সময়? এবং সম্ভবত তাদেরও এটি করতে হবে, কারণ সহযোগিতা এবং অ্যালগরিদমের সংমিশ্রণই সত্যিকারের সর্বজনীন এআই (এজিআই) বাস্তবায়নের একমাত্র উপায়। এখানে মেশিন লার্নিং পদ্ধতির বিবর্তনের পথ এবং ভবিষ্যতে কী হতে পারে তা দেওয়া হয়েছে।
পাঁচটি প্রধান ধারা
1 প্রতীকীবাদ: জ্ঞানকে চিহ্নিত করার জন্য এবং যৌক্তিক যুক্তির জন্য প্রতীক, নিয়ম এবং যুক্তি ব্যবহার করা হয়। সর্বাধিক পছন্দের অ্যালগরিদম হল নিয়ম এবং সিদ্ধান্ত গাছ 2 Bayesian: সম্ভাব্যতা অনুমান করার জন্য সম্ভাব্যতা প্রাপ্তি, সর্বাধিক পছন্দের অ্যালগরিদমঃ সরল বেয়েজ বা মারকভ ৩. কানেক্টিভিজমঃ সম্ভাব্যতা ম্যাট্রিক্স এবং ভারী নিউরন ব্যবহার করে গতিশীলভাবে প্যাটার্নগুলি সনাক্ত এবং পুনরাবৃত্তি করতে, সর্বাধিক পছন্দের অ্যালগরিদমঃ নিউরাল নেটওয়ার্ক ৪. বিবর্তনবাদ: পরিবর্তন তৈরি করা এবং তারপরে নির্দিষ্ট লক্ষ্যের জন্য সেরাটি অর্জন করা, সর্বাধিক পছন্দের অ্যালগরিদমঃ জেনেটিক অ্যালগরিদম 5 Analogizer: কন্ডিশনাল কন্ডিশনের উপর ভিত্তি করে ফাংশনটি অপ্টিমাইজ করুন ((যতটা সম্ভব উচ্চতর যান, তবে একই সাথে রাস্তা ছেড়ে যাবেন না)) । সর্বাধিক পছন্দের অ্যালগরিদমঃ ভেক্টর মেশিন সমর্থন করে
বিবর্তনের ধাপ
১৯৮০ এর দশক
প্রধান ধারাঃ প্রতীকীবাদ আর্কিটেকচারঃ সার্ভার বা ল্যাপটপ মূল তত্ত্বঃ জ্ঞান প্রকৌশল মৌলিক সিদ্ধান্ত গ্রহণের যুক্তিঃ সিদ্ধান্ত গ্রহণের সহায়ক ব্যবস্থা, সীমিত ব্যবহারিকতা
১৯৯০ থেকে ২০০০
প্রধান ধারাবাহিকঃ বেয়েস স্থাপত্যঃ ছোট সার্ভার ক্লাস্টার মূল তত্ত্ব: সম্ভাব্যতা তত্ত্ব শ্রেণিবিন্যাসঃ অনেক কাজের জন্য যথেষ্ট ভাল, তুলনা বা তুলনা করা যায়
২০১০-এর দশকের প্রথম দিকে
প্রধান ধারাবাহিকতা: সংযুক্তবাদ আর্কিটেকচারঃ বড় সার্ভার ফার্ম মূল তত্ত্বঃ স্নায়ুবিজ্ঞান এবং সম্ভাব্যতা শনাক্তকরণঃ ছবি ও শব্দ শনাক্তকরণ, অনুবাদ, আবেগ বিশ্লেষণ ইত্যাদির ক্ষেত্রে আরও বেশি নির্ভুলতা
এই শিল্পীরা একসাথে কাজ করতে এবং তাদের নিজস্ব পদ্ধতিকে একত্রিত করতে চায়।
২০১০-এর দশকের শেষের দিকে
লিঙ্কবাদ + প্রতীকীবাদ কাঠামোঃ অনেকগুলো মেঘ প্রধান তত্ত্বঃ স্মৃতির স্নায়ুসংক্রান্ত নেটওয়ার্ক, ব্যাপক একীকরণ, জ্ঞানভিত্তিক যুক্তি সহজ প্রশ্নোত্তরঃ সংকীর্ণ, ক্ষেত্র-নির্দিষ্ট জ্ঞান ভাগাভাগি
২০২০-এর দশক+
লিগালিজম + সিম্বলিজম + বেয়েস + … আর্কিটেকচারঃ ক্লাউড এবং ফাগ কম্পিউটিং প্রচলিত তত্ত্বঃ অনুভূতির সময় নেটওয়ার্ক থাকে, যুক্তি এবং কাজের সময় নিয়ম থাকে সহজ উপলব্ধি, যুক্তি এবং কর্মঃ সীমিত স্বয়ংক্রিয়তা বা মানব-মানব ইন্টারঅ্যাকশন
২০৪০-এর দশক+
মূলধারার ধারাঃ আলগোরিদিমের একত্রীকরণ আর্কিটেকচারঃ সর্বত্র সার্ভার মূল তত্ত্ব: সেরা সমন্বয়যুক্ত মেটা-লার্নিং উপলব্ধি এবং প্রতিক্রিয়াঃ বিভিন্ন শিক্ষণ পদ্ধতির মাধ্যমে অর্জিত জ্ঞান বা অভিজ্ঞতার ভিত্তিতে কর্ম বা উত্তর প্রদান করা
কোন ধরনের মেশিন লার্নিং অ্যালগরিদম ব্যবহার করা উচিত? এটা নির্ভর করে যে, কতটুকু ডাটা পাওয়া যায় এবং কোন ব্যবহারের ক্ষেত্রে আপনি কোন প্রশিক্ষণ নিতে চান তার উপর। সবচেয়ে জটিল অ্যালগরিদম ব্যবহার করবেন না, যদি না এর ফলাফল ব্যয়বহুল এবং সম্পদ বহনযোগ্য হয়। এখানে কিছু সাধারণ অ্যালগরিদম দেওয়া হল, যা ব্যবহারের সহজতার ভিত্তিতে সাজানো হয়েছে।
সিদ্ধান্ত গাছঃ ধাপে ধাপে উত্তর দেওয়ার সময়, একটি সাধারণ সিদ্ধান্ত গাছ বিশ্লেষণ স্তরবিন্যাস পরিবর্তনশীল বা সিদ্ধান্তের নোড ব্যবহার করে, উদাহরণস্বরূপ, একটি প্রদত্ত ব্যবহারকারীকে ক্রেডিট নির্ভরযোগ্য বা অবিশ্বস্ত হিসাবে শ্রেণিবদ্ধ করা যায়।
দক্ষতাঃ বিভিন্ন বৈশিষ্ট্য, গুণাবলী এবং ব্যক্তি, স্থান এবং জিনিসগুলির বৈশিষ্ট্যগুলির একটি পরিসীমা মূল্যায়ন করার দক্ষতা উদাহরণঃ নিয়ম-ভিত্তিক ক্রেডিট মূল্যায়ন, ঘোড়ার ফলাফলের পূর্বাভাস
সাপোর্ট ভেক্টর মেশিনঃ সুপারপ্লেনের উপর ভিত্তি করে, সাপোর্ট ভেক্টর মেশিন ডেটা সেটকে শ্রেণিবদ্ধ করতে পারে।
সুবিধাসমূহঃ ভেক্টর মেশিন সমর্থন করে যা ভেরিয়েবল এক্স এবং অন্যান্য ভেরিয়েবলের মধ্যে দ্বিগুণ শ্রেণিবদ্ধকরণ পরিচালনা করতে পারে, তাদের সম্পর্কটি রৈখিক হোক বা না হোক উদাহরণস্বরূপঃ সংবাদ শ্রেণিবদ্ধকরণ, হাতের লেখা শনাক্তকরণ।
Regression: Regression একটি ক্রমবৈকল্পিক পরিবর্তনশীল এবং এক বা একাধিক ক্রমবৈকল্পিকের মধ্যে অবস্থার সম্পর্ককে চিত্রিত করে। এই উদাহরণে, স্প্যাম এবং নন-স্প্যামের মধ্যে পার্থক্য করা হয়েছে।
সুবিধাসমূহঃ রিগ্রেশন ব্যবহার করা যেতে পারে পরিবর্তনশীল মধ্যে ধারাবাহিক সম্পর্ক সনাক্ত করতে, এমনকি যদি এই সম্পর্ক খুব সুস্পষ্ট নয় উদাহরণস্বরূপঃ রাস্তার ট্রাফিক বিশ্লেষণ, মেইল ফিল্টারিং
Naive Bayes Classification: Naive Bayes Classification সম্ভাব্য শর্তের শাখা-সম্ভাবনা হিসাব করার জন্য ব্যবহৃত হয়। প্রতিটি স্বতন্ত্র বৈশিষ্ট্যই “নবীন” বা শর্তাধীন, তাই তারা অন্য বস্তুর উপর প্রভাব ফেলবে না। উদাহরণস্বরূপ, 5 টি হলুদ এবং লাল ছোট বলের একটি বাক্সের মধ্যে, পরপর দুটি হলুদ ছোট বলের সম্ভাবনা কত? চিত্রের উপরের শাখা থেকে দেখা যায়, আগে এবং পরে দুটি হলুদ ছোট বলের সম্ভাবনা 1/10। Naive Bayes classifier একাধিক বৈশিষ্ট্যের সম্মিলিত শর্তাধীন সম্ভাবনা হিসাব করতে পারে।
উপকারিতা: ছোট ডাটাসেটে প্রাসঙ্গিক বস্তুর উল্লেখযোগ্য বৈশিষ্ট্যগুলির জন্য, সরল বেয়েজ পদ্ধতিগুলি দ্রুত শ্রেণিবদ্ধ করতে পারে উদাহরণস্বরূপঃ আবেগ বিশ্লেষণ, ভোক্তা শ্রেণীবিভাগ
লুকানো মার্কভ মডেলঃ লুকানো মার্কভ প্রক্রিয়া হল সম্পূর্ণ নিশ্চিততা যা দেখায় যে একটি প্রদত্ত অবস্থা প্রায়শই অন্যের সাথে থাকে। ট্রাফিক সিগন্যাল একটি উদাহরণ। বিপরীতে, লুকানো অবস্থার ঘটনার জন্য দৃশ্যমান ডেটা বিশ্লেষণ করে লুকানো মার্কভ মডেল গণনা করা হয়। তারপরে, লুকানো অবস্থার বিশ্লেষণের সাহায্যে, লুকানো মার্কভ মডেল সম্ভাব্য ভবিষ্যতের পর্যবেক্ষণের ধরন অনুমান করতে পারে। এই ক্ষেত্রে, উচ্চ বা নিম্ন বায়ুচাপের সম্ভাবনা (এটি একটি লুকানো অবস্থা) একটি উজ্জ্বল, বৃষ্টির, মেঘলা দিনের সম্ভাবনা অনুমান করতে ব্যবহার করা যেতে পারে।
সুবিধাসমূহঃ তথ্যের পরিবর্তনশীলতা অনুমোদন করা, স্বীকৃতি এবং ভবিষ্যদ্বাণীমূলক ক্রিয়াকলাপের জন্য উপযুক্ত উদাহরণঃ মুখের ভাব বিশ্লেষণ, আবহাওয়ার পূর্বাভাস
র্যান্ডম বনঃ র্যান্ডম বন অ্যালগরিদম সিদ্ধান্ত গাছের যথার্থতা উন্নত করে। এটি একাধিক গাছের সাথে র্যান্ডমভাবে নির্বাচিত ডেটা উপসেট ব্যবহার করে। এই উদাহরণটি স্তন ক্যান্সারের পুনরাবৃত্তির সাথে সম্পর্কিত প্রচুর জিনকে জিনের অভিব্যক্তি স্তরে পরীক্ষা করে এবং পুনরাবৃত্তির ঝুঁকি গণনা করে।
উপকারিতাঃ র্যান্ডম ফরেস্ট পদ্ধতিটি বড় আকারের ডেটাসেট এবং প্রচুর এবং কখনও কখনও অপ্রাসঙ্গিক বৈশিষ্ট্যযুক্ত আইটেমগুলির জন্য কার্যকর প্রমাণিত হয়েছে উদাহরণস্বরূপঃ ব্যবহারকারীর প্রবাহ বিশ্লেষণ, ঝুঁকি মূল্যায়ন
পুনরাবৃত্ত নিউরাল নেটওয়ার্কঃ একটি পুনরাবৃত্ত নিউরাল নেটওয়ার্কে, প্রতিটি নিউরন 1 বা একাধিক লুকানো স্তরগুলির মাধ্যমে অনেকগুলি ইনপুটকে একটি একক আউটপুটতে রূপান্তর করে। একটি পুনরাবৃত্ত নিউরাল নেটওয়ার্ক (আরএনএন) স্তরবিন্যাসকে আরও স্তরবিন্যাস করে, স্তরবিন্যাস শেখার অনুমতি দেয়। অন্য কথায়, আরএনএন একটি ধরণের স্মৃতি রয়েছে যা পূর্ববর্তী আউটপুটকে পরবর্তী আউটপুটকে প্রভাবিত করার অনুমতি দেয়।
সুবিধাসমূহঃ বৃত্তাকার নিউরাল নেটওয়ার্কগুলি প্রচুর পরিমাণে সংগঠিত তথ্যের উপস্থিতিতে ভবিষ্যদ্বাণী করতে পারে উদাহরণঃ ছবির শ্রেণিবিন্যাস এবং সাবটাইটেল যোগ করা, রাজনৈতিক আবেগ বিশ্লেষণ
দীর্ঘ স্বল্পমেয়াদী স্মৃতি (LSTM) এবং গেটযুক্ত পুনরাবৃত্ত ইউনিট নিউরাল নেটওয়ার্ক (GATU): এই প্রাথমিক RNNগুলির মধ্যে ক্ষয়ক্ষতি রয়েছে। যদিও এই প্রাথমিক পুনরাবৃত্ত নিউরাল নেটওয়ার্কগুলি কেবলমাত্র অল্প পরিমাণে প্রাথমিক তথ্য সংরক্ষণের অনুমতি দেয়, সাম্প্রতিক দীর্ঘমেয়াদী স্মৃতি (LSTM) এবং গেটযুক্ত পুনরাবৃত্ত ইউনিট (GRU) নিউরাল নেটওয়ার্কগুলির দীর্ঘমেয়াদী এবং স্বল্পমেয়াদী স্মৃতি রয়েছে। অন্য কথায়, এই সাম্প্রতিক আরএনএনগুলির আরও ভাল নিয়ন্ত্রণ ক্ষমতা রয়েছে যা পূর্বের মানগুলি সংরক্ষণের অনুমতি দেয় বা যখন অনেকগুলি ধারাবাহিক পদক্ষেপের সাথে কাজ করার প্রয়োজন হয় তখন এই মানগুলি পুনরায় সেট করে, যা “ধাপে ধাপে” বা ধাপে ধাপে স্থানান্তরিত মানগুলির চূড়ান্ত অবনতি এড়ায়।
সুবিধাসমূহঃ দীর্ঘ স্বল্পমেয়াদী স্মৃতি এবং গেট কন্ট্রোল সাইক্লিং সেল নিউরাল নেটওয়ার্ক অন্যান্য সাইক্লিং নিউরাল নেটওয়ার্কগুলির মতোই সুবিধাগুলি রয়েছে, তবে তারা আরও ভাল স্মৃতিশক্তির কারণে আরও বেশি ব্যবহৃত হয় উদাহরণঃ প্রাকৃতিক ভাষা প্রক্রিয়াকরণ, অনুবাদ
Convolutional neural network: কনভলুশনাল নিউরাল নেটওয়ার্ক হল পরবর্তী স্তর থেকে আসা ওজনগুলির সংমিশ্রণ, যা আউটপুট স্তরকে চিহ্নিত করতে ব্যবহৃত হয়।
সুবিধাসমূহ: খুব বড় ডেটাসেট, প্রচুর বৈশিষ্ট্য এবং জটিল শ্রেণিবদ্ধকরণ কাজ থাকলে কভোল্টেজ নিউরাল নেটওয়ার্ক খুবই উপযোগী উদাহরণস্বরূপঃ ছবি সনাক্তকরণ, পাঠ্য-ভয়েস ট্রান্সক্রিপশন, ওষুধের আবিষ্কার
http://usblogs.pwc.com/emerging-technology/a-look-at-machine-learning-infographic/
http://usblogs.pwc.com/emerging-technology/machine-learning-methods-infographic/
http://usblogs.pwc.com/emerging-technology/machine-learning-evolution-infographic/
বিগ ডেটা প্ল্যাটফর্ম থেকে পুনর্নির্দেশিত