درجہ بندی کرنے والے فیصلے کرنے کے لئے ڈیزائن کردہ درجہ بندی کرنے والوں کی نظریاتی بنیادیں:
موازنہ P (ωi) x؛ جہاںωi کلاس i ہے اور x ایک ڈیٹا ہے جس کا مشاہدہ کیا گیا ہے اور درجہ بندی کی جارہی ہے ، P (ωi) x بیان کرتا ہے کہ اس ڈیٹا کے خصوصیت ویکٹر کے بارے میں معلوم ہونے کی صورت میں ، اس کا فیصلہ کرنے کا کیا امکان ہے کہ یہ کلاس i میں ہے ، جو پسماندگی کا امکان بھی بن جاتا ہے۔ بائیز فارمولے کے مطابق ، اسے اس طرح بیان کیا جاسکتا ہے:
ان میں سے ، P ((x)
درجہ بندی کرتے وقت ، x کو دیئے جانے پر ، اس زمرے کا انتخاب کیا جاسکتا ہے جس میں P (ωi) کی سب سے زیادہ امکان ہے۔ جب P (ωi) ہر زمرے کے ساتھ موازنہ کیا جاتا ہے تو ،ωi متغیر ہے اور x مستحکم ہے۔ لہذا ، P (ωi) کو خارج کر دیا جاسکتا ہے اور اس پر غور نہیں کیا جاسکتا ہے۔
لہذا آخر میں یہ P (x) x (ωi) * P (ωi) کا حساب کتاب کرنے کا مسئلہ بن جاتا ہے۔ پیشگی امکان P ((ωi) اچھا ہے ، اگر اعدادوشمار کی تربیت ہر درجہ بندی کے تحت ظاہر ہونے والے اعداد و شمار کے تناسب کو جمع کرے۔
اس طرح کے امکانات P (x
ذیل میں k قریبی ہمسایہ الگورتھم کے بارے میں بتایا گیا ہے۔
ہم ٹریننگ سیٹ کے اعداد و شمار x1، x2، xn (جن میں سے ہر ایک اعداد و شمار m طول و عرض ہے) کے مطابق ان اعداد و شمار کی تقسیم کو زمرہωi کے تحت فٹ کرنا چاہتے ہیں۔ x کو m طول و عرض کی جگہ میں کسی بھی نقطہ کے طور پر مقرر کریں، P (xωi) کو کیسے حساب کریں؟
ہم جانتے ہیں کہ جب اعداد و شمار کافی بڑے ہوتے ہیں تو تناسب کے قریب امکانات استعمال کیے جاسکتے ہیں۔ اس اصول کا استعمال کرتے ہوئے ، نقطہ x کے آس پاس کے قریب ترین نمونہ کے نقطہ کی تلاش کریں ، جس میں قسم i کا کوئی ki ہے۔ اس قسم کے نمونہ کے نقطہ کو گھیرنے والے سب سے چھوٹے سپر گول کی مقدار V کا حساب لگائیں۔ یا پھر نمونہ کے تمام اعداد و شمار میں سے کسی بھی قسم کے فرد کی تعداد کی تلاش کریں Ni:
آپ دیکھ سکتے ہیں کہ ہم نے جو حساب لگایا ہے وہ اصل میں x پوائنٹ پر کلاس کی حالت کی احتمال کثافت ہے۔
P (ωi) کیا ہے؟
مندرجہ بالا طریقہ کار کے مطابق، P ((ωi) = Ni/N ⋅ جہاں N نمونہ کی کل تعداد ہے۔
اس کے علاوہ ، P ((x) = k/ ((N * V) ، جہاں k اس سپر گول کو گھیرنے والے تمام نمونہ پوائنٹس کی تعداد ہے۔ N نمونہ کی کل تعداد ہے۔
تو P ((ωi
P(ωi|x)=ki/k
مزید وضاحت کرنے کے لئے، ایک V سائز کے سپر اسکرپٹ میں، k نمونوں کو گھیر لیا جاتا ہے، جن میں سے i کلاس میں شامل ہیں؛ اس طرح، جس قسم کے نمونوں کو گھیر لیا جاتا ہے وہ سب سے زیادہ ہے، ہم اس بات کا تعین کرتے ہیں کہ یہاں x کس قسم کا ہونا چاہئے؛ یہ ایک درجہ بندی ہے جو k قریبی ہمسایہ الگورتھم کے ساتھ ڈیزائن کیا گیا ہے۔