مارکوف ماڈل، ایک بار جب یہ بہت اعلی درجے کی آواز آتی ہے، تو ہم بالکل نہیں جانتے کہ یہ کیا ہے، لہذا ہم ایک قدم پیچھے ہٹیں گے اور پہلے مارکوف چین کو دیکھیں گے.
مارکوف سلسلہ، جس کا نام آندرے مارکوف (A.A.Markov، 1856-1922) کے نام سے لیا گیا ہے (یہ وہ شخص ہے) ، ریاضی میں مارکوف کی نوعیت کے متفرق واقعات کے بے ترتیب عمل کا حوالہ دیتا ہے۔ موجودہ علم یا معلومات کے پیش نظر ، ماضی (یعنی موجودہ سابقہ تاریخی حالت) مستقبل (یعنی موجودہ سے بعد کی مستقبل کی حالت) کی پیش گوئی کرنے کے لئے لاعلمی ہے۔
اس عمل میں ہر حالت کی منتقلی صرف پچھلی n حالتوں پر منحصر ہوتی ہے۔ اس عمل کو ایک n درجے کا ماڈل کہا جاتا ہے، جہاں n تبدیلیوں پر اثر انداز ہونے والے ریاستوں کی تعداد ہے۔ سب سے آسان مارکوف عمل ایک درجے کا عمل ہے، جس میں ہر حالت کی منتقلی صرف اس سے پہلے کی حالت پر منحصر ہوتی ہے۔
روزمرہ کی زندگی کی ایک مثال دیں، جہاں ہم موجودہ موسم کی صورتحال کے مطابق مستقبل کے موسم کی پیش گوئی کرنا چاہتے ہیں۔ ایک طریقہ یہ ہے کہ اس ماڈل کی ہر حالت صرف پچھلی حالت پر منحصر ہے، یعنی مارکوف کا مفروضہ، جو اس مسئلے کو بہت آسان بنا دیتا ہے۔ یقیناً یہ مثال بھی کچھ غیر عملی ہے۔ تاہم، اس طرح کا ایک آسان نظام ہمارے تجزیے کے لیے فائدہ مند ہو سکتا ہے، لہذا ہم عام طور پر اس مفروضے کو قبول کرتے ہیں کیونکہ ہم جانتے ہیں کہ اس طرح کا نظام ہمیں کچھ مفید معلومات فراہم کرتا ہے، اگرچہ یہ بہت درست نہیں ہے۔
اوپر دی گئی تصویر میں ماڈل دکھایا گیا ہے جس میں موسم کی تبدیلی کی گئی ہے۔
نوٹ کریں کہ N ریاستوں پر مشتمل ایک مرحلے کے عمل میں N2 ریاست کی تبدیلی ہوتی ہے۔ ہر تبدیلی کا امکان ریاست کی تبدیلی کا امکان کہا جاتا ہے، یعنی ایک ریاست سے دوسری ریاست میں منتقل ہونے کا امکان۔ یہ تمام N2 امکانات ایک ریاست کی تبدیلی میٹرکس کے ذریعہ ظاہر کیے جاسکتے ہیں ، جیسا کہ موسم کی مثال میں ریاست کی تبدیلی میٹرکس مندرجہ ذیل ہے۔
یہ میٹرکس بتاتا ہے کہ اگر کل ابر آلود تھا تو آج 25 فیصد امکان ہے کہ یہ صاف ستھرا ہو گا، 12.5 فیصد امکان ہے کہ ابر آلود ہو گا، 62.5 فیصد امکان ہے کہ بارش ہوگی، اور واضح طور پر میٹرکس میں ہر سطر کا مجموعہ 1 ہے۔
اس طرح کے نظام کو شروع کرنے کے لئے، ہمیں ایک ابتدائی امکان ویکٹر کی ضرورت ہے:
یہ ویکٹر ظاہر کرتا ہے کہ پہلا دن روشن ہے۔ یہاں تک کہ ہم نے پہلے مرحلے کے مارکوف عمل کے لئے مندرجہ ذیل تین حصوں کی وضاحت کی ہے:
حالات: دھوپ، بادل اور بارش۔
ابتدائی ویکٹر: نظام کی حالت کا امکان بیان کرتا ہے جب وقت 0 ہے۔
حالت کی تبدیلی کا میٹرکس: ہر موسم کی تبدیلی کا امکان۔ تمام نظام جو اس طرح بیان کیے جاسکتے ہیں وہ ایک مارکوف عمل ہے۔
تاہم ، جب مارکوف کا عمل کافی طاقتور نہیں ہوتا ہے تو ہم کیا کرتے ہیں؟ کچھ معاملات میں ، مارکوف کا عمل ان نمونوں کو بیان کرنے کے لئے کافی نہیں ہے جو ہم تلاش کرنا چاہتے ہیں۔
مثال کے طور پر ہمارے اسٹاک مارکیٹ میں، اگر ہم صرف مارکیٹ کا مشاہدہ کرتے ہیں، تو ہم صرف اس دن کی قیمت، حجم وغیرہ کے بارے میں جان سکتے ہیں، لیکن ہمیں نہیں معلوم کہ موجودہ اسٹاک مارکیٹ کس حالت میں ہے (بوس مارکیٹ، بیئر مارکیٹ، ہلچل، ریبلس وغیرہ) ، اس صورت میں ہمارے پاس دو حالتوں کا مجموعہ ہے، ایک قابل مشاہدہ حالت (اسٹاک مارکیٹ کی حالت وغیرہ) اور ایک پوشیدہ حالت کا مجموعہ (اسٹاک مارکیٹ کی حالت) ۔ ہم ایک ایسا الگورتھم تلاش کرنے کی امید کرتے ہیں جو اسٹاک مارکیٹ کی حالت اور مارکوف مفروضے کے مطابق اسٹاک مارکیٹ کی حالت کی پیش گوئی کرے۔
مندرجہ بالا حالات میں، مشاہدہ کی جانے والی ریاستوں کی ترتیب اور پوشیدہ ریاستوں کی ترتیب امکانات سے متعلق ہیں۔ لہذا ہم اس قسم کے عمل کو ماڈلنگ کر سکتے ہیں کہ ایک پوشیدہ مارکوف عمل ہے اور اس پوشیدہ مارکوف عمل کے امکانات سے متعلق اور مشاہدہ کی جانے والی ریاستوں کا ایک مجموعہ ہے، جسے پوشیدہ مارکوف ماڈل کہا جاتا ہے۔
خفیہ مارکوف ماڈل (انگریزی: Hidden Markov Model) ایک شماریاتی ماڈل ہے جس کا استعمال کسی ایسے مارکوف عمل کو بیان کرنے کے لئے کیا جاتا ہے جس میں نامعلوم نامعلوم پیرامیٹرز شامل ہیں۔ اس کا مشکل نقطہ یہ ہے کہ مشاہدہ شدہ پیرامیٹرز سے اس عمل کے خفیہ پیرامیٹرز کا تعین کیا جائے اور پھر ان پیرامیٹرز کا استعمال کرتے ہوئے مزید تجزیہ کیا جائے۔ ذیل میں ایک تین ریاستوں کا خفیہ مارکوف ماڈل ریاست کی منتقلی کا گراف ہے ، جہاں x پوشیدہ حالت کی نمائندگی کرتا ہے ، y مشاہدہ شدہ آؤٹ پٹ کی نمائندگی کرتا ہے ، a حالت کی تبدیلی کا امکان ہے ، اور b آؤٹ پٹ کا امکان ہے۔
ایک جوڑی کی مثال کے طور پر بیان کریں: فرض کریں کہ میرے ہاتھ میں تین مختلف جوڑی ہیں۔ پہلی جوڑی ہماری معمول کی جوڑی ہے۔ (اس جوڑی کو ڈی 6 کہتے ہیں) ، 6 رخا ، ہر رخا (ایک ، دو ، تین ، چار ، پانچ ، چھ) کا امکان 1/6 ہے۔ دوسری جوڑی ایک چوتھائی ہے۔ (اس جوڑی کو ڈی 4 کہتے ہیں) ، ہر رخا (ایک ، دو ، تین ، چار) کا امکان 1/4 ہے۔ تیسری جوڑی کے آٹھ رخا ہیں (اس جوڑی کو ڈی 8 کہتے ہیں) ، ہر رخا (ایک ، دو ، تین ، چار ، پانچ ، چھ ، سات ، آٹھ) کا امکان 1/8 ہے۔
فرض کریں کہ ہم ایک ڈبے کے ساتھ شروع کرتے ہیں، ہم پہلے تین ڈبے میں سے ایک کو چنتے ہیں، اور ہر ڈبے کو چننے کا امکان 1/3 ہے۔ پھر ہم ڈبے کو چنتے ہیں، ایک عدد، 1,2,3,4,5,6,7,8 میں سے ایک۔ مسلسل اس عمل کو دہراتے ہیں، ہم ایک عدد بناتے ہیں، ہر عدد 1,2,3,4,5,6,7,8 میں سے ایک ہوتا ہے۔ مثال کے طور پر ہم اس طرح کا عدد بن سکتے ہیں (ڈبے 10 بار) 1: 6 3 5 2 7 3 5 2 4
اس سلسلہ کو دیکھا جا سکتا ہے کہ ریاست سلسلہ کہا جاتا ہے۔ لیکن پوشیدہ مارکوف ماڈل میں، ہم صرف اس سلسلہ کو دیکھا جا سکتا ہے کہ ریاست سلسلہ ہے، لیکن یہ بھی ایک پوشیدہ ریاست سلسلہ ہے. اس مثال میں، یہ پوشیدہ ریاست سلسلہ آپ کو استعمال کر سکتے ہیں کہ چوٹیوں کی ایک سیریز ہے. مثال کے طور پر، پوشیدہ ریاست سلسلہ ہو سکتا ہے: D4 D6 D8 D6 D4 D8 D6 D6 D4 D4.
一般来说,HMM中说到的马尔可夫链其实是指隐含状态链,因为隐含状态(骰子)之间存在转换概率。在我们这个例子里,D6的下一个状态是D4,D6,D8的概率都是1/3。D4,D8的下一个状态是D4,D6,D8的转换概率也都一样是1/3。这样设定是为了最开始容易说清楚,但是我们其实是可以随意设定转换概率的。比如,我们可以这样定义,D6后面不能接D4,D6后面是D6的概率是0.9,是D8的概率是0.1。这样就是一个新的HMM。
اسی طرح، اگرچہ ظاہر حالت کے درمیان کوئی تبدیلی کا امکان نہیں ہے، لیکن پوشیدہ حالت اور ظاہر حالت کے درمیان ایک امکان ہے جسے آؤٹ پٹ کا امکان کہا جاتا ہے۔ ہماری مثال میں، چھ رخا ڈوز (D6) 1 پیدا کرنے کا امکان 1/6 ہے۔ 2,3,4,5,6 پیدا کرنے کا امکان بھی 1/6 ہے۔ ہم بھی آؤٹ پٹ کے امکانات کی دوسری تعریف کر سکتے ہیں۔ مثال کے طور پر، میرے پاس چھ رخا ڈوز ہے جو جوئے بازی کے اڈوں میں ہاتھ سے چل رہا ہے، اور باہر نکلنے کا امکان 1 سے بڑا ہے، 1/2 ہے، اور باہر نکلنے کا امکان 2،3،4،5،6 ہے، 1/10 ہے۔
HMM کے لئے ، اگر آپ کو تمام پوشیدہ حالتوں کے مابین تبادلوں کے امکانات اور تمام پوشیدہ حالتوں کے مابین تمام ظاہر حالتوں کے درمیان آؤٹ پٹ کے امکانات کو پہلے سے جاننا ہے تو ، مشابہت کرنا کافی آسان ہے۔ لیکن جب HMM ماڈل کا استعمال کرتے ہو تو ، اکثر کچھ معلومات غائب ہوجاتی ہیں ، بعض اوقات آپ کو پتہ ہوتا ہے کہ کئی جوتے ہیں ، ہر جوتی کیا ہے ، لیکن جوتے کی ترتیب نہیں معلوم ہوتی ہے۔ بعض اوقات آپ صرف بہت سارے جوتے کے نتائج دیکھتے ہیں ، اور باقی کچھ نہیں جانتے ہیں۔ اگر آپ ان لاپتہ معلومات کا اندازہ لگانے کے لئے الگورتھم کا اطلاق کرتے ہیں تو یہ ایک اہم مسئلہ ہے۔
ایچ ایم ایم ماڈل سے متعلق الگورتھم بنیادی طور پر تین قسموں میں تقسیم ہوتے ہیں ، جو تین مسائل کو حل کرتے ہیں:
پتہ ہے کہ کئی قسم کے ڈبے ہیں (محتمل حالتوں کی تعداد) ، ہر ڈبے کا کیا مطلب ہے (تبدیلی کا امکان) ، اور اس کے نتائج کے مطابق (مظاہر حالت کی زنجیر) ، میں جاننا چاہتا ہوں کہ ہر بار کس قسم کا ڈبہ (محتمل حالت کی زنجیر) کھڑا ہوتا ہے۔
اور یہ بھی جاننا کہ مونے کے کئی قسمیں ہیں (محتمل حالتوں کی تعداد) ، ہر مونے کا کیا امکان ہے (تبدیلی کا امکان) ، اور مونے کے نتائج کے مطابق (ظاہری حالت کا سلسلہ) ، میں جاننا چاہتا ہوں کہ اس نتائج کے نتائج کا امکان کیا ہے۔
یہ جان کر کہ کئی قسم کے ڈونگ ہیں (محتمل حالتوں کی تعداد) ، یہ نہیں جاننا کہ ہر قسم کا ڈونگ کیا ہے (تبدیلی کا امکان) ، بہت سارے ڈونگ کے نتائج کا مشاہدہ کرنا (ظاہری حالت کا سلسلہ) ، میں ہر قسم کا ڈونگ کیا ہے (تبدیلی کا امکان) کو ریورس کرنا چاہتا ہوں۔
اگر ہم اسٹاک مارکیٹ کے مسائل کو حل کرنا چاہتے ہیں تو ہمیں مسئلہ 1 اور مسئلہ 3 کو حل کرنے کی ضرورت ہے۔ اگلی پوسٹ میں ہم دیکھیں گے کہ کیسے۔
مینی کوڈ کے بارے میں جاننے والے کالم سے نقل کیا گیا