خواتین و حضرات، اپنی شرط لگائیں۔ آج ہم ایک اورنگو کو شکست دینے کے لئے اپنی پوری کوشش کریں گے، جسے مالیاتی دنیا میں سب سے زیادہ خوفناک حریفوں میں سے ایک سمجھا جاتا ہے۔ ہم اپنی کرنسیوں کی تجارت کی اقسام کی اگلے دن کی آمدنی کی پیش گوئی کرنے کی کوشش کر رہے ہیں۔ میں آپ کو یقین دلاتا ہوں: یہاں تک کہ اگر آپ کسی بھی قسم کی شرط کو شکست دینا چاہتے ہیں اور 50 فیصد جیتنے کا امکان رکھتے ہیں تو یہ ایک مشکل کام ہے۔ ہم ایک تیار شدہ مشین سیکھنے کے الگورتھم کا استعمال کریں گے جو ویکٹر کی درجہ بندی کی حمایت کرتا ہے۔ ویکٹر کی ایس وی ایم مشین رجعت اور درجہ بندی کے کاموں کو حل کرنے کا ایک ناقابل یقین حد تک طاقتور طریقہ ہے۔
ایس وی ایم ویکٹر مشین اس خیال پر مبنی ہے کہ ہم سپر فلیٹ کے مقابلے میں پی ڈی خصوصیت کی جگہ کی درجہ بندی کرسکتے ہیں۔ ایس وی ایم ویکٹر مشین کے الگورتھم میں ایک سپر فلیٹ اور ایک تشخیصی مارجن استعمال کیا جاتا ہے تاکہ درجہ بندی کے فیصلے کی سرحدیں بنائی جاسکیں ، جیسا کہ ذیل میں دکھایا گیا ہے۔
سب سے آسان صورت میں ، لکیری درجہ بندی ممکن ہے۔ الگورتھم نے فیصلہ کن حدود کا انتخاب کیا ، جس سے کلاسوں کے مابین فاصلے کو زیادہ سے زیادہ کیا جاسکتا ہے۔
آپ کو زیادہ تر مالیاتی وقت کی سیریز میں آسان ، لکیری الگ الگ سیٹوں کا سامنا کرنا پڑتا ہے۔ ایس وی ایم ویکٹر نے اس مسئلے کو حل کرنے کے لئے ایک طریقہ کار کو نافذ کیا ہے جسے نرم مارجن طریقہ کہا جاتا ہے۔
اس معاملے میں ، کچھ غلط درجہ بندی کی صورت حال کی اجازت ہے ، لیکن وہ خود ہی کام انجام دیتے ہیں تاکہ C (جس کی لاگت یا بجٹ میں غلطی کی اجازت دی جاسکتی ہے) کے ساتھ تناسب کے عوامل اور غلطیوں کو حد تک کم سے کم کرنے کے لئے فاصلے کو کم کریں۔
بنیادی طور پر ، مشینیں درجہ بندی کے مابین وقفے کو زیادہ سے زیادہ کرنے کی کوشش کرتی ہیں ، جبکہ اس کے C کے ذریعہ وزن میں آنے والی سزاؤں کو کم کرنے کی کوشش کرتی ہیں۔
ایس وی ایم ٹارگٹر کی ایک عمدہ خصوصیت یہ ہے کہ اس کی درجہ بندی کے فیصلے کی حدود کا مقام اور سائز صرف کچھ اعداد و شمار کے ذریعہ طے ہوتا ہے ، یعنی فیصلہ کی حدود سے قریب ترین اعداد و شمار۔ اس الگورتھم کی خصوصیات اس بات کا امکان بناتی ہیں کہ یہ دور دراز کے وقفے کے غیر معمولی اقدار کی مداخلت کا مقابلہ کرے۔ مثال کے طور پر ، اوپر دیئے گئے گراف میں ، سب سے اوپر دائیں نیلے رنگ کے نقطے ، فیصلہ کی حدود پر بہت کم اثر ڈالتے ہیں۔
کیا یہ بہت پیچیدہ ہے؟ ٹھیک ہے ، مجھے لگتا ہے کہ مزہ ابھی شروع ہوا ہے۔
ذیل کی صورت حال پر غور کریں (سرخ نقطے کو دوسرے رنگوں سے الگ کریں):
انسانوں کے لئے، یہ درجہ بندی کرنا بہت آسان ہے (ایک اوولف لائن بھی) ؛ لیکن مشینوں کے لئے یہ مختلف ہے۔ ظاہر ہے، یہ سیدھی لائن نہیں بن سکتی (ایک سیدھی لائن سرخ نقطوں کو الگ نہیں کر سکتی) ؛ یہاں ہم کرنل ٹرک کو آزما سکتے ہیں۔
نیوکلیئر تکنیک ایک بہت ہی ذہین ریاضیاتی تکنیک ہے جو ہمیں اعلی جہتی خلا میں لکیری درجہ بندی کے مسائل کو حل کرنے کی اجازت دیتی ہے۔ اب ہم دیکھتے ہیں کہ یہ کیسے ہوتا ہے۔
ہم دو جہتی خصوصیت کی جگہ کو تین جہتی میں تبدیل کریں گے اور درجہ بندی مکمل کرنے کے بعد دو جہتی میں واپس آئیں گے۔
ذیل میں ایک تصویر ہے جس میں اس کا نقشہ بنایا گیا ہے اور اس کی درجہ بندی کی گئی ہے:
عام طور پر، اگر آپ کے پاس d ان پٹ ہیں تو، آپ d ان پٹ کی جگہ سے p خصوصیت کی جگہ پر ایک نقشہ استعمال کرسکتے ہیں۔ مندرجہ بالا کم سے کم کرنے والے الگورتھم کو چلانے سے حل پیدا ہوگا، اور پھر آپ کی اصل ان پٹ کی جگہ کے p طول و عرض کے سپر فلیٹ کو واپس کریں گے۔
مذکورہ بالا ریاضیاتی حل کا ایک اہم شرط یہ ہے کہ اس پر منحصر ہے کہ خصوصیت کی جگہ میں اچھے نقطہ نمونے کے سیٹ کیسے تیار کیے جائیں۔
آپ کو صرف ان نکاتی نمونہ سیٹوں کی ضرورت ہوتی ہے تاکہ سرحد کی اصلاح کی جاسکے ، نقشہ سازی کو واضح کرنے کی ضرورت نہیں ہے ، اور ان پٹ اسپیس میں اعلی جہتی خصوصیت کی جگہ پر پوائنٹس کو نیوکلیئر فنکشن ((اور تھوڑا سا مرسر تھیوری کی مدد سے) محفوظ طریقے سے شمار کیا جاسکتا ہے۔
مثال کے طور پر، آپ کو ایک بہت بڑی خصوصیت کی جگہ میں آپ کی درجہ بندی کے مسئلے کو حل کرنا چاہتے ہیں، فرض کریں کہ یہ 100،000 طول و عرض ہے. کیا آپ کو تصور کر سکتے ہیں کہ آپ کو کتنی کمپیوٹنگ کی صلاحیت کی ضرورت ہے؟ میں اس کے بارے میں بہت شکوک و شبہات کا اظہار کرتا ہوں کہ آپ اسے انجام دے سکتے ہیں. ٹھیک ہے، جوہری اب آپ کو ان نقطہ نمونے کو شمار کرنے کی اجازت دیتا ہے، لہذا یہ کنارے آپ کی کم کثافت کے آرام دہ اور پرسکون ان پٹ کی جگہ سے آتا ہے.
اب ہم جیف کی پیش گوئی کرنے کی صلاحیت کو شکست دینے کے چیلنج کا سامنا کرنے کے لئے تیار ہیں۔ آئیے جیف کو دیکھتے ہیں:
جیف کرنسی منڈیوں کے ماہر ہیں اور وہ 50 فیصد تک کی پیش گوئی کی درستگی حاصل کرنے کے لئے بے ترتیب شرط لگاتے ہیں، جس کا مطلب یہ ہے کہ اگلے تجارتی دن کی واپسی کی پیش گوئی کرنے کا اشارہ ہے۔
ہم مختلف بنیادی ٹائم سیریز استعمال کریں گے ، بشمول فوری قیمت ٹائم سیریز ، ہر ٹائم سیریز میں 10 لاگس تک کے فوائد ، مجموعی طور پر 55 خصوصیات۔
ایس وی ایم ویکٹر مشین جو ہم تیار کرنے کے لئے تیار ہیں وہ 3 ڈگری کے نچلے حصے کا استعمال کرتی ہے۔ آپ تصور کر سکتے ہیں کہ ایک مناسب نچلے حصے کا انتخاب کرنا ایک اور بہت ہی مشکل کام ہے ، تاکہ سی اور جی پیرامیٹرز کی توثیق کی جاسکے۔ 3 گنا کراس چیک ممکنہ پیرامیٹرز کے مجموعوں کے گرڈ پر چلتا ہے ، اور بہترین سیٹ کا انتخاب کیا جائے گا۔
اس کے نتیجے میں کچھ بھی حوصلہ افزا نہیں ہے:
ہم دیکھ سکتے ہیں کہ لکیری رجعت یا ایس وی ایم ویکٹر دونوں جیف کو شکست دے سکتے ہیں۔ اگرچہ نتائج خوش آئند نہیں ہیں ، لیکن ہم ڈیٹا سے کچھ معلومات بھی نکال سکتے ہیں ، جو اچھی خبر ہے ، کیونکہ اعداد و شمار کے شعبے میں ، مالی وقت کی ترتیب میں روزانہ کی آمدنی سب سے زیادہ مفید نہیں ہے۔
کراس تصدیق کے بعد ، ڈیٹا سیٹ کو تربیت دی جائے گی اور اس کی جانچ کی جائے گی ، ہم نے تربیت یافتہ ایس وی ایم کی پیشن گوئی کی صلاحیت کو ریکارڈ کیا ہے ، تاکہ مستحکم کارکردگی کا مظاہرہ کیا جاسکے ، ہم نے ہر کرنسی کو 1000 بار تصادفی تقسیم کیا ہے۔
اس طرح ، کچھ معاملات میں ، ایس وی ایم سادہ لکیری واپسی سے بہتر ہے ، لیکن کارکردگی میں بھی تھوڑا سا فرق ہے۔ مثال کے طور پر ، امریکی ڈالر اور ین میں ، ہم اوسطا 54 فیصد اشارے کی پیش گوئی کرسکتے ہیں۔ یہ کافی اچھا نتیجہ ہے ، لیکن آئیے اس پر مزید گہری نظر ڈالیں!
ٹیڈ جیف کا کزن ہے، جو یقیناً ایک گورانڈا بھی ہے، لیکن یہ جیف سے زیادہ ہوشیار ہے۔ ٹیڈ نے اپنی آنکھوں کو ٹریننگ نمونہ سیٹ پر لگایا ہے، نہ کہ کسی بے ترتیب شرط پر۔ اس نے ہمیشہ ٹریننگ سیٹ کے سب سے عام آؤٹ پٹ سے بریک سگنل دیئے ہیں۔ اب آئیے ہم ذہین ٹیڈ کو بطور معیار استعمال کریں:
جیسا کہ ہم نے دیکھا ہے کہ زیادہ تر ایس وی ایمز کی کارکردگی صرف اس حقیقت سے منسلک ہے کہ مشین سیکھنے کے مطابق درجہ بندی کا امکان پہلے سے کہیں زیادہ نہیں ہے۔ حقیقت یہ ہے کہ لکیری رجحانات خصوصیت کی جگہ سے کوئی معلومات حاصل نہیں کرسکتے ہیں ، لیکن اس کا مطلب یہ ہے کہ اس کی واپسی میں انٹرسیپٹ معنی خیز ہے ، اور اس حقیقت سے متعلق ہے کہ انٹرسیپٹ اور ایک مخصوص درجہ بندی کو زیادہ بہتر کارکردگی کا مظاہرہ کرتے ہیں۔
ایک چھوٹی سی اچھی خبر یہ ہے کہ ایس وی ایم ویکٹر ڈیٹا سے کچھ اضافی غیر لکیری معلومات حاصل کرنے میں کامیاب ہے، جس سے ہم اپنی پیشن گوئی کی درستگی کو 2 فیصد تک لے سکتے ہیں۔
بدقسمتی سے، ہم ابھی تک نہیں جانتے کہ یہ کیا معلومات ہوسکتی ہے، جیسے ایس وی ایم ویکٹر مشینوں کے اپنے اہم نقصانات ہیں، جو ہم واضح طور پر وضاحت نہیں کرسکتے ہیں.
مصنف: پی۔ لوپیز، کوانٹ ڈیر پر شائع ہوا ویکیپیڈیا پبلک نمبر سے نقل کیا گیا
سنہری9966زور آور