مشین لرننگ میں ، مقصد یا تو پیش گوئی ہے (پروڈکشن) یا گروپنگ (کلسٹرنگ) ؛ اس مضمون میں پیش گوئی پر توجہ دی گئی ہے۔ پیش گوئی ان پٹ متغیرات کے ایک سیٹ سے آؤٹ پٹ متغیرات کی قدر کا اندازہ لگانے کا عمل ہے۔ مثال کے طور پر ، متعلقہ گھر کی خصوصیات کے ایک سیٹ حاصل کرنے کے بعد ، ہم اس کی فروخت کی قیمت کا اندازہ لگا سکتے ہیں۔ پیش گوئی کے مسائل کو دو بڑی اقسام میں تقسیم کیا جاسکتا ہے۔ اس کے بعد ، آئیے مشین لرننگ میں سب سے زیادہ نمایاں اور عام طور پر استعمال ہونے والے الگورتھم کو دیکھتے ہیں۔ ہم ان کو تین اقسام میں تقسیم کرتے ہیں: لکیری ماڈل ، درخت پر مبنی ماڈل ، اور اعصابی نیٹ ورکس ، جن میں سے چھ پر توجہ دی جاتی ہے:
لکیری رجعت ، یا زیادہ درست طور پر ، فاریکس ٹریڈنگ کے بہترین اختیارات کیا ہیں؟ کا سب سے معیاری فارم ہے۔ لکیری رجعت رجعت کے مسائل کے ل the ، لکیری رجعت سب سے آسان لکیری ماڈل ہے۔ اس کا نقصان یہ ہے کہ ماڈل آسانی سے اوور فٹ ہوجاتا ہے ، یعنی ، ماڈل مکمل طور پر تربیت یافتہ اعداد و شمار کے مطابق ہوجاتا ہے ، اس کی قیمت پر نئے اعداد و شمار میں توسیع کرنے کی صلاحیت پر۔ لہذا ، مشین سیکھنے میں لکیری رجعت (اور منطقی رجعت جس کے بارے میں ہم بعد میں بات کریں گے) عام طور پر موڈل کیپشن ہے ، جس کا مطلب ہے کہ ماڈل کو اوور فٹ ہونے سے روکنے کے لئے کچھ سزا ہے۔
لکیری ماڈلز کا ایک اور نقصان یہ ہے کہ چونکہ وہ بہت آسان ہیں ، لہذا جب ان پٹ متغیرات آزاد نہیں ہوتے ہیں تو وہ زیادہ پیچیدہ طرز عمل کی پیش گوئی کرنے میں آسان نہیں ہوتے ہیں۔
منطقی رجعت درجہ بندی کے مسئلے کے لئے لکیری رجعت کی موافقت ہے۔ منطقی رجعت کے نقصانات لکیری رجعت کی طرح ہیں۔ منطقی افعال درجہ بندی کے مسئلے کے لئے بہت اچھے ہیں کیونکہ اس نے تھریڈ ویلیو اثر متعارف کرایا ہے۔
فیصلے کا درخت ہر ممکنہ نتائج کی ایک تصویر ہے جس میں فیصلے کو دکھایا گیا ہے۔ مثال کے طور پر، آپ نے سلاد کا حکم دینے کا فیصلہ کیا ہے، آپ کا پہلا فیصلہ ممکنہ طور پر خام کیلے کی قسم ہے، اس کے بعد آم اور پھر سلاد کی قسم. ہم ایک فیصلے کے درخت میں تمام ممکنہ نتائج ظاہر کر سکتے ہیں.
فیصلے کے درخت کو تربیت دینے کے لیے ہمیں ٹریننگ ڈیٹاسیٹ کا استعمال کرنے کی ضرورت ہوتی ہے اور یہ معلوم کرنا پڑتا ہے کہ مقصد کے لیے کون سی صفت سب سے زیادہ مفید ہے۔ مثال کے طور پر، دھوکہ دہی کے پتہ لگانے کے استعمال کی مثال میں، ہم یہ تلاش کر سکتے ہیں کہ ملک دھوکہ دہی کے خطرے کی پیشن گوئی کرنے میں سب سے زیادہ اثر انداز ہوتا ہے۔ پہلی صفت کے ساتھ شاخ بندی کرنے کے بعد، ہمیں دو ذیلی سیٹ ملتی ہیں، جو کہ سب سے زیادہ درست اندازہ لگانے کے قابل ہوتی ہیں اگر ہم صرف پہلی صفت کو جانتے ہوں۔ پھر ہم دوسری اچھی صفت کا پتہ لگاتے ہیں جو ان دونوں ذیلی سیٹوں کے ساتھ شاخ بندی کی جا سکتی ہے، دوبارہ تقسیم کرتے ہیں، اور اسی طرح بار بار استعمال کرتے ہیں، جب تک کہ کافی تعداد میں صفتیں موجود نہ ہوں تاکہ مقصد کی ضروریات پوری کی جا سکیں۔
بے ترتیب جنگل بہت سے فیصلے کے درختوں کا اوسط ہے، جن میں سے ہر ایک فیصلے کے درخت کو بے ترتیب اعداد و شمار کے نمونے کے ساتھ تربیت دی جاتی ہے۔ بے ترتیب جنگل میں ہر ایک درخت ایک مکمل فیصلے کے درخت سے کمزور ہے، لیکن تمام درختوں کو ایک ساتھ ڈالنے سے، ہم تنوع کے فوائد کی وجہ سے بہتر مجموعی کارکردگی حاصل کرسکتے ہیں۔
بے ترتیب جنگل آج مشین سیکھنے میں ایک بہت ہی مقبول الگورتھم ہے۔ بے ترتیب جنگل کی تربیت کرنا آسان ہے ، اور اس کی کارکردگی کافی اچھی ہے۔ اس کا نقصان یہ ہے کہ بے ترتیب جنگل کی پیداوار کی پیش گوئی دوسرے الگورتھم کے مقابلے میں سست ہوسکتی ہے ، لہذا جب تیز پیش گوئی کی ضرورت ہو تو ، بے ترتیب جنگل کا انتخاب نہیں کیا جاسکتا ہے۔
گریڈینٹ بوسٹنگ ، جیسے بے ترتیب جنگلات ، کمزور اور کمزور فیصلہ سازی کے درختوں پر مشتمل ہے۔ گریڈینٹ بوسٹنگ کا سب سے بڑا فرق یہ ہے کہ گریڈینٹ بوسٹنگ میں ، درختوں کو ایک ایک کرکے تربیت دی جاتی ہے۔ ہر پچھلے درخت کو بنیادی طور پر سامنے والے درختوں کے ذریعہ غلط اعداد و شمار کی نشاندہی کرنے کی تربیت دی جاتی ہے۔ اس سے گریڈینٹ بوسٹنگ میں آسانی سے پیش گوئی کرنے والے حالات پر زیادہ توجہ دی جاتی ہے ، اور کم مشکل حالات پر زیادہ توجہ دی جاتی ہے۔
گرڈ اپ ٹریننگ بھی تیز ہے اور بہت اچھی کارکردگی کا مظاہرہ کرتی ہے۔ تاہم ، ٹریننگ ڈیٹاسیٹ میں چھوٹی چھوٹی تبدیلیاں ماڈل میں بنیادی تبدیلیاں لا سکتی ہیں ، لہذا اس کے نتیجے میں ممکنہ طور پر سب سے زیادہ قابل عمل نتائج نہیں مل سکتے ہیں۔
بگ ڈیٹا پلیٹ فارم سے نقل کیا گیا