आज हम आपको शेयरों पर HMM (इंटरमार्कोव मॉडल) के सरल अनुप्रयोगों के बारे में बताएंगे।
एक गुप्त मार्कोव मॉडल, एक बार जब यह बहुत उच्च प्रतीत होता है, तो यह बिल्कुल भी नहीं जानता कि यह क्या है, तो चलो एक कदम पीछे हटते हैं और पहले मार्कोव श्रृंखला को देखते हैं।
मार्कोव श्रृंखला, जिसका नाम एंड्रयू मार्कोव (ए.ए. मार्कोव, 1856-1922) के नाम पर रखा गया है, गणित में मार्कोव के गुणों वाली असतत घटनाओं की यादृच्छिक प्रक्रिया को संदर्भित करती है। वर्तमान ज्ञान या जानकारी के मामले में, अतीत (यानी वर्तमान पूर्व ऐतिहासिक स्थिति) भविष्य की भविष्यवाणी करने के लिए प्रासंगिक नहीं है (यानी वर्तमान के बाद भविष्य की स्थिति) ।
इस प्रक्रिया में, प्रत्येक अवस्था का स्थानांतरण केवल पिछली n अवस्थाओं पर निर्भर करता है, इस प्रक्रिया को 1 n-स्तर का मॉडल कहा जाता है, जिसमें n स्थानांतरण अवस्थाओं को प्रभावित करने वाली संख्या है। सबसे सरल मार्कोव प्रक्रिया एक-चरण प्रक्रिया है, जिसमें प्रत्येक अवस्था का स्थानांतरण केवल उससे पहले की स्थिति पर निर्भर करता है।
गणित में, यह इस तरह दिखता हैः
उदाहरण के लिए, हम वर्तमान मौसम की स्थिति के आधार पर भविष्य के मौसम की भविष्यवाणी करना चाहते हैं। एक तरीका यह है कि इस मॉडल में प्रत्येक स्थिति केवल पिछली स्थिति पर निर्भर करती है, जो कि मार्कोव की धारणा है, जो इस समस्या को बहुत सरल बनाती है। बेशक, यह उदाहरण भी कुछ हद तक अव्यावहारिक है। लेकिन, इस तरह की एक सरलीकृत प्रणाली हमारे विश्लेषण के लिए फायदेमंद हो सकती है, इसलिए हम आमतौर पर इस तरह की धारणा को स्वीकार करते हैं क्योंकि हम जानते हैं कि ऐसी प्रणाली हमें कुछ उपयोगी जानकारी देती है, हालांकि बहुत सटीक नहीं है।
उपरोक्त चित्र में मौसम के लिए एक मॉडल दिखाया गया है।
ध्यान दें कि N अवस्थाओं वाले एक चरण के प्रक्रिया में N2 अवस्था परिवर्तन होते हैं। प्रत्येक परिवर्तन की संभावना को अवस्था परिवर्तन की संभावना कहा जाता है, यानी एक अवस्था से दूसरी अवस्था में स्थानांतरण की संभावना। इन सभी N2 संभावनाओं को एक अवस्था परिवर्तन मैट्रिक्स द्वारा दर्शाया जा सकता है, जैसा कि मौसम उदाहरण में देखा गया हैः
यह मैट्रिक्स बताती है कि अगर कल बादल थे, तो आज 25% संभावना है कि यह अच्छा दिन होगा, 12.5% संभावना है कि यह बादल होगा, 62.5% संभावना है कि यह बारिश होगी, और यह स्पष्ट है कि मैट्रिक्स में प्रत्येक पंक्ति का योग 1 है।
इस तरह के एक प्रणाली को आरंभ करने के लिए, हमें एक आरंभिक संभावना वेक्टर की आवश्यकता हैः
यह वेक्टर बताता है कि पहला दिन अच्छा है. यहाँ तक, हमने ऊपर दिए गए पहले चरण के मार्कोव प्रक्रिया के लिए निम्नलिखित तीन भागों को परिभाषित किया हैः
स्थितिः अच्छा दिन, बादल और बारिश।
प्रारंभिक वेक्टरः समय 0 पर सिस्टम के राज्य की संभावना को परिभाषित करता है।
स्थिति परिवर्तन मैट्रिक्सः प्रत्येक मौसम परिवर्तन की संभावनाएं. सभी प्रणालीएं जो इस तरह से वर्णित की जा सकती हैं, एक मार्कोव प्रक्रिया हैं.
हालांकि, जब मार्कोव प्रक्रियाएं पर्याप्त शक्तिशाली नहीं होती हैं, तो हम क्या करते हैं? कुछ मामलों में, मार्कोव प्रक्रियाएं उन पैटर्नों का वर्णन करने के लिए पर्याप्त नहीं हैं जिन्हें हम ढूंढना चाहते हैं।
उदाहरण के लिए हमारा स्टॉक मार्केट, अगर हम केवल बाजार का अवलोकन करते हैं, तो हम केवल उस दिन के मूल्य, लेनदेन आदि के बारे में जानकारी प्राप्त कर सकते हैं, लेकिन यह नहीं जानते कि वर्तमान में स्टॉक मार्केट किस स्थिति में है (बैल बाजार, भालू बाजार, उथल-पुथल, उछाल, आदि), इस मामले में हमारे पास दो स्थिति सेट हैं, एक अवलोकन योग्य स्थिति सेट और एक छिपा हुआ स्थिति सेट (स्टॉक बाजार की स्थिति) । हम एक एल्गोरिथ्म खोजने की उम्मीद कर रहे हैं जो स्टॉक बाजार की स्थिति और मार्कोव परिकल्पना के आधार पर स्टॉक बाजार की स्थिति का अनुमान लगा सके।
उपरोक्त सभी स्थितियों में, अवलोकन योग्य अवस्थाओं के क्रम और छिपे हुए अवस्थाओं के क्रम की संभावनाएं संबंधित हैं। इस प्रकार, हम इस प्रकार के प्रक्रियाओं को एक छिपे हुए मार्कोव प्रक्रिया और इस छिपे हुए मार्कोव प्रक्रिया की संभावनाओं से संबंधित और अवलोकन योग्य अवस्थाओं के एक सेट के रूप में मॉडलिंग कर सकते हैं, जिसे छिपे हुए मार्कोव मॉडल कहा जाता है।
छिपा हुआ मार्कोव मॉडल एक सांख्यिकीय मॉडल है जिसका उपयोग एक मार्कोव प्रक्रिया का वर्णन करने के लिए किया जाता है जिसमें छिपे हुए अज्ञात पैरामीटर होते हैं। इसकी कठिनाई यह है कि इस प्रक्रिया के छिपे हुए पैरामीटर को अवलोकन योग्य पैरामीटर से निर्धारित किया जाए और फिर इन पैरामीटरों का उपयोग करके आगे का विश्लेषण किया जाए। नीचे दी गई छवि तीन-राज्य छिपे हुए मार्कोव मॉडल के राज्य स्थानांतरण ग्राफ है, जिसमें x छिपे हुए राज्य को दर्शाता है, y अवलोकन योग्य आउटपुट को दर्शाता है, a राज्य रूपांतरण की संभावना है, और b आउटपुट की संभावना है।
एक ड्यूक के उदाहरण का उपयोग करके इसे स्पष्ट करेंः मान लीजिए कि मेरे हाथ में तीन अलग-अलग ड्यूक हैं; पहला ड्यूक हमारा सामान्य ड्यूक है ((इस ड्यूक को D6 कहते हैं), 6 पक्ष हैं, प्रत्येक पक्ष के होने की संभावना 1/6 है। दूसरा ड्यूक एक चतुर्भुज है ((इस ड्यूक को D4 कहते हैं, प्रत्येक पक्ष को 1, 2, 3, 4) होने की संभावना 1/4 है। तीसरा ड्यूक आठ पक्षों वाला है ((इस ड्यूक को D8 कहते हैं, प्रत्येक पक्ष के होने की संभावना 1/8 है ((1, 2, 3, 4, 5, 6, 7, 8) ।
मान लीजिए कि हम डेक शुरू करते हैं, हम पहले तीन डेक में से एक को चुनते हैं, और प्रत्येक डेक के लिए संभावना 1/3 है। फिर हम डेक, एक संख्या, 1, 2, 3, 4, 5, 6, 7, 8 में से एक प्राप्त करते हैं। उपरोक्त प्रक्रिया को लगातार दोहराएं, हम एक संख्या श्रृंखला प्राप्त करते हैं, प्रत्येक संख्या 1, 2, 3, 4, 5, 6, 7, 8 में से एक है। उदाहरण के लिए हम इस तरह की संख्या श्रृंखला प्राप्त कर सकते हैं ((डेक 10 बार) 1: 6 3 5 2 7 3 5 2 4
इस संख्याओं को दृश्यमान स्थिति श्रृंखला कहा जाता है. लेकिन गुप्त मार्कोव मॉडल में, हमारे पास न केवल दृश्यमान स्थिति श्रृंखला है, बल्कि एक गुप्त स्थिति श्रृंखला भी है. इस उदाहरण में, यह गुप्त स्थिति श्रृंखला आपके द्वारा उपयोग की जाने वाली कुकी की एक श्रृंखला है. उदाहरण के लिए, गुप्त स्थिति श्रृंखला हो सकती हैः D4 D6 D8 D6 D4 D8 D6 D6 D4 ।
一般来说,HMM中说到的马尔可夫链其实是指隐含状态链,因为隐含状态(骰子)之间存在转换概率。在我们这个例子里,D6的下一个状态是D4,D6,D8的概率都是1/3。D4,D8的下一个状态是D4,D6,D8的转换概率也都一样是1/3。这样设定是为了最开始容易说清楚,但是我们其实是可以随意设定转换概率的。比如,我们可以这样定义,D6后面不能接D4,D6后面是D6的概率是0.9,是D8的概率是0.1。这样就是一个新的HMM。
इसी तरह, यद्यपि दृश्य अवस्थाओं के बीच कोई रूपांतरण संभावना नहीं है, लेकिन एक संभावना है जिसे निष्कर्षण की संभावना कहा जाता है। हमारे उदाहरण में, छक्के (D6) के लिए 1 का उत्पादन करने की संभावना 1/6 है। 2, 3, 4, 5, 6 का उत्पादन करने की संभावना भी 1/6 है। हम निष्कर्षण की संभावना के लिए अन्य परिभाषाएं भी कर सकते हैं। उदाहरण के लिए, मेरे पास एक छक्के है जिसे कैसीनो में एक पैर से अधिक चलाया जाता है, और बाहर निकलने की संभावना 1 से अधिक है, 1/2 है, और बाहर निकलने की संभावना 2, 3, 4, 5, 6 है, 1/10 है।
वास्तव में, एचएमएम के लिए, यदि आप पहले से ही सभी अव्यक्त अवस्थाओं के बीच रूपांतरण की संभावना और सभी अव्यक्त अवस्थाओं के बीच सभी दृश्यमान अवस्थाओं के बीच आउटपुट की संभावना जानते हैं, तो अनुकरण करना काफी आसान है। लेकिन एचएमएम मॉडल का उपयोग करते समय, अक्सर कुछ जानकारी गायब होती है, कभी-कभी आप जानते हैं कि कई कंबल हैं, प्रत्येक कंबल क्या है, लेकिन कंबल अनुक्रमों को नहीं जानते हैं; कभी-कभी आप केवल कई बार कंबल के परिणाम देखते हैं, और बाकी कुछ भी नहीं जानते हैं। यदि आप इन लापता सूचनाओं का अनुमान लगाने के लिए एल्गोरिदम लागू करते हैं, तो यह एक महत्वपूर्ण समस्या है।
एचएमएम मॉडल से संबंधित एल्गोरिदम मुख्य रूप से तीन श्रेणियों में विभाजित हैं, जो तीन समस्याओं को हल करते हैंः
पता है कि कितने प्रकार के कंकड़ हैं (अवतरित अवस्थाओं की संख्या), प्रत्येक कंकड़ क्या है (परिवर्तन की संभावना), और कंकड़ के परिणामों के आधार पर (दृश्यमान अवस्था श्रृंखला), मैं जानना चाहता हूं कि प्रत्येक बार कंकड़ किस प्रकार का होता है (अवतरित अवस्था श्रृंखला) ।
क्या आप जानते हैं कि कई प्रकार के कबूतर हैं (अनिवार्य अवस्थाओं की संख्या), प्रत्येक कबूतर क्या है (परिवर्तन की संभावना), और कबूतर के परिणामों के आधार पर (दृश्यमान स्थिति श्रृंखला) मैं जानना चाहता हूं कि इस परिणाम के लिए कबूतर की संभावना क्या है।
यह जानकर कि कई प्रकार के डंडे हैं (अनिवार्य अवस्थाओं की संख्या), यह नहीं जानकर कि प्रत्येक प्रकार के डंडे क्या हैं (परिवर्तन की संभावना), कई बार डंडे के परिणामों का अवलोकन करना (दृश्यमान अवस्था श्रृंखला), मैं यह उल्टा करना चाहता हूं कि प्रत्येक प्रकार के डंडे क्या हैं (परिवर्तन की संभावना) ।
अगर हम स्टॉक एक्सचेंजों में समस्या को हल करना चाहते हैं, तो हमें समस्या 1 और समस्या 3 को हल करना होगा, अगले लेख में हम देखेंगे कि कैसे।
Moneycode के बारे में जानने वाले लेख से पुनर्प्रकाशित