এই সময়ের মধ্যে মেশিনটি মেশিনটি শিখতে শিখেছিল, মেশিনটি শিখেছিল, মেশিনের 5 তম অধ্যায়ের মেশিনের লজিস্টিক রিগ্রেশন মেশিনটি শিখেছিল, এটি বেশ শক্ত লাগছিল। এই ট্র্যাকিংয়ের উত্স, মেশিনের লজিস্টিক রিগ্রেশন মেশিন থেকে মেশিনের লিনিয়ার রিগ্রেশন মেশিন পর্যন্ত, এবং মেশিনের সর্বনিম্ন দ্বিগুণ মেশিন পর্যন্ত। অবশেষে মেশিনের উচ্চতর গণিত মেশিনের (৬ষ্ঠ সংস্করণ, নীচের বই) ৯ অধ্যায়ের ১০ নং অধ্যায়ের মেশিনের সর্বনিম্ন দ্বিগুণ মেশিনের সাথে সামঞ্জস্য করা হয়েছিল, যা সর্বনিম্ন দ্বিগুণ মেশিনের পিছনে গাণিতিক নীতিটি কোথা থেকে এসেছে তা বুঝতে পেরেছিল।
১৮০১ সালে, ইতালীয় জ্যোতির্বিজ্ঞানী জুসেপ পিয়াজি প্রথম গ্রহাণু উপগ্রহটি আবিষ্কার করেন। ৪০ দিনের ট্র্যাকিং পর্যবেক্ষণের পরে, উপগ্রহটি সূর্যের পিছনে চলে যাওয়ার কারণে পিয়াজি উপগ্রহটির অবস্থান হারিয়ে ফেলেছিলেন। তারপরে বিশ্বব্যাপী বিজ্ঞানীরা পিয়াজির পর্যবেক্ষণের তথ্য ব্যবহার করে উপগ্রহটির সন্ধান শুরু করেছিলেন, তবে বেশিরভাগ লোকের গণনার ফলাফল অনুসারে কোনও ফলাফল পাওয়া যায়নি। ২৪ বছর বয়সী গাউসও উপগ্রহের কক্ষপথ গণনা করেছিলেন। অস্ট্রিয়ান জ্যোতির্বিজ্ঞানী হাইরিচ ওলবার্স গাউসের কক্ষপথের ভিত্তিতে উপগ্রহটি পুনরায় আবিষ্কার করেছিলেন।
গাউসের সর্বনিম্ন দ্বিগুণের পদ্ধতি ১৮০৯ খ্রিস্টাব্দে তার গ্রন্থে প্রকাশিত হয়। ফরাসি বিজ্ঞানী লেজেন্ডার স্বাধীনভাবে ১৮০৬ খ্রিস্টাব্দে সর্বনিম্ন দ্বিগুণের সূত্র আবিষ্কার করেন।
১৮২৯ খ্রিস্টাব্দে, গাউস প্রমাণ করেছিলেন যে সর্বনিম্ন দ্বিগুণের অপ্টিমাইজেশান কার্যকারিতা অন্যান্য পদ্ধতির চেয়ে শক্তিশালী।
ধরুন আমরা কিছু যুদ্ধজাহাজের দৈর্ঘ্য এবং প্রস্থের তথ্য সংগ্রহ করেছি।
আমরা পাইথনে এই তথ্যের উপর ভিত্তি করে একটি বিন্দু গ্রাফ আঁকতে পারিঃ
পয়েন্ট গ্রাফ আঁকার কোড নিম্নরূপঃ
import numpy as np # -*- coding: utf-8 -*
import os
import matplotlib.pyplot as plt
def drawScatterDiagram(fileName): # 改变工作路径到数据文件存放的地方
os.chdir("d:/workspace_ml")
xcord=[];ycord=[]
fr=open(fileName)
for line in fr.readlines():
lineArr=line.strip().split()
xcord.append(float(lineArr[1]));ycord.append(float(lineArr[2]))
plt.scatter(xcord,ycord,s=30,c='red',marker='s')
plt.show()
যদি আমরা প্রথম দুইটি বিন্দু নিই (২৩৮, ৩২.৪) (১৫২, ১৫.৫) তাহলে আমরা দুটি সমীকরণ পাব। ১৫২a+b=১৫.৫ ৩২৮a + b = 32.4 এই দুটি সমীকরণ সমাধান করুন, a = 0.197, b = -14.48 তাহলে আমরা এইরকম একটি অনুকরণ গ্রাফ পেতে পারিঃ
ঠিক আছে, নতুন প্রশ্ন হল, a, b কি সর্বোত্তম? পেশাদারদের মতে, a, b কি মডেলের সর্বোত্তম পরামিতি? এই প্রশ্নের উত্তর দেওয়ার আগে, আমরা আরেকটি প্রশ্নের সমাধান করবঃ কোন শর্তে a, b সর্বোত্তম?
উত্তর হলঃ সব ডেটা এর বর্গ এবং সর্বনিম্ন বিচ্যুতি নিশ্চিত করা। নীতি সম্পর্কে, আমরা পরে কথা বলব, প্রথমে এই সরঞ্জামটি ব্যবহার করে সেরা a এবং b গণনা করা যায়। সব ডেটা এর বর্গ এবং M অনুমান করা হয়,
এখন আমাদের যা করতে হবে তা হল M কে a এবং b এর মধ্যে সর্বনিম্ন করা। লক্ষ্য করুন এই সমীকরণে, আমরা জানি যে yi এবং xi
আসলে এই সমীকরণটি একটি দ্বিপদী ফাংশন যার মধ্যে a, b হল নিজের ভেরিয়েবল এবং M হল ভেরিয়েবলের কারন।
মনে রাখবেন কিভাবে উচ্চসংখ্যার ক্ষেত্রে একক ফাংশনের জন্য সর্বোচ্চ মান হয়। আমরা মূলধারার এই সরঞ্জামটি ব্যবহার করি। তাহলে বাইনারি ফাংশনে, আমরা এখনও মূলধারার ব্যবহার করি। তবে এখানে মূলধারার একটি নতুন নাম আছে। M এর বিভাজককে জিজ্ঞাসা করলে আমরা একটি সমীকরণ পাবো।
এই দুটি সমীকরণের মধ্যে x এবং y উভয়ই জানা যায়।
এটি একটি সহজ প্রশ্ন এবং একটি সহজ উত্তর। উইকিপিডিয়ার তথ্য ব্যবহার করে, আমি এখানে সরাসরি উত্তর দিয়ে একটি উপযুক্ত চিত্র আঁকবঃ
# -*- coding: utf-8 -*importnumpy as npimportosimportmatplotlib.pyplot as pltdefdrawScatterDiagram(fileName):
# 改变工作路径到数据文件存放的地方os.chdir("d:/workspace_ml")xcord=[];
# ycord=[]fr=open(fileName)forline infr.readlines():lineArr=line.strip().split()xcord.append(float(lineArr[1]));
# ycord.append(float(lineArr[2]))plt.scatter(xcord,ycord,s=30,c='red',marker='s')
# a=0.1965;b=-14.486a=0.1612;b=-8.6394x=np.arange(90.0,250.0,0.1)y=a*x+bplt.plot(x,y)plt.show()
# -*- coding: utf-8 -*
import numpy as np
import os
import matplotlib.pyplot as plt
def drawScatterDiagram(fileName):
#改变工作路径到数据文件存放的地方
os.chdir("d:/workspace_ml")
xcord=[];ycord=[]
fr=open(fileName)
for line in fr.readlines():
lineArr=line.strip().split()
xcord.append(float(lineArr[1]));ycord.append(float(lineArr[2]))
plt.scatter(xcord,ycord,s=30,c='red',marker='s')
#a=0.1965;b=-14.486
a=0.1612;b=-8.6394
x=np.arange(90.0,250.0,0.1)
y=a*x+b
plt.plot(x,y)
plt.show()
ডাটা ফিটনেসের ক্ষেত্রে, কেন মডেলের প্যারামিটারগুলিকে অপ্টিমাইজ করার জন্য মডেলের পূর্বাভাসের ডেটাকে প্রকৃত ডেটার সাথে পার্থক্যের বর্গক্ষেত্রের পরিবর্তে নিখুঁত মান এবং সর্বনিম্ন করা হয়?
এই প্রশ্নের উত্তর কেউ দিয়েছে, লিঙ্ক দেখুন।http://blog.sciencenet.cn/blog-430956-621997.html)
ব্যক্তিগতভাবে আমি এই ব্যাখ্যাটি খুব আকর্ষণীয় মনে করি; বিশেষ করে এর মধ্যে থাকা অনুমানটিঃ f (x) এর সমস্ত বিচ্যুতির পয়েন্টগুলিতে শব্দ রয়েছে।
একটি পয়েন্টের বিচ্যুতি যত বেশি হবে, শব্দটি তত বেশি হবে। তাহলে বিচ্যুতির মাত্রা x এর সাথে সম্ভাব্যতা f (x) এর সম্পর্ক কী?
উপরের সবগুলিই দ্বি-মাত্রিক, অর্থাৎ শুধুমাত্র একটি স্ব-ভেরিয়েবল। কিন্তু বাস্তব জগতে, যা চূড়ান্ত ফলাফলকে প্রভাবিত করে তা হল একাধিক কারণের উপর নির্ভরশীল, অর্থাৎ স্ব-ভেরিয়েবলের একাধিক ঘটনা।
সাধারণ এন মেট্রো-লিনিয়ার ফাংশনগুলির জন্য, লিনিয়ার-লিনিয়ার-এলজিবারের তালের মধ্যে বিপরীত ম্যাট্রিক্সের সাথে অনুসন্ধান করা ঠিক আছে; কারণ একটি উপযুক্ত উদাহরণ অস্থায়ীভাবে পাওয়া যায় নি, এটি একটি কন্ডাক্টর হিসাবে এখানে রয়েছে।
অবশ্যই, প্রকৃতি একটি বহুবচন সমন্বয়, সহজ রৈখিকতা নয়, যা উচ্চতর বিষয়বস্তু।
মূল কাজ, অনুলিপি করার অনুমতি দেওয়া হয়, অনুলিপি করার সময় দয়া করে নিবন্ধটির মূল উত্স, লেখক সম্পর্কিত তথ্য এবং এই বিবৃতিটি হাইপারলিঙ্ক আকারে চিহ্নিত করুন; অন্যথায় আইনী দায়বদ্ধতা অনুসরণ করা হবে।http://sbp810050504.blog.51cto.com/2799422/1269572