4
ध्यान केंद्रित करना
1113
समर्थक

क्या आप एसवीएम वेक्टर मशीनों के साथ दांव लगाकर (व्यापार करके) गोरिल्लाओं से आगे निकल सकते हैं?

में बनाया: 2016-11-01 11:51:41, को अपडेट: 2016-11-01 11:53:28
comments   3
hits   3450

क्या आप एसवीएम वेक्टर मशीनों के साथ दांव लगाकर (व्यापार करके) गोरिल्लाओं से आगे निकल सकते हैं?

देवियो और सज्जनों, अपने दांव लगाओ। आज, हम एक ओरिगामी को हराने के लिए अपना सर्वश्रेष्ठ प्रयास करेंगे, जिसे वित्तीय क्षेत्र में सबसे भयानक प्रतिद्वंद्वियों में से एक माना जाता है। मैं आपको विश्वास दिलाता हूं, यहां तक कि एक यादृच्छिक बाजी मारना और 50% जीतने की संभावना वाला एक गिलहरी भी एक कठिन काम है। हम एक तैयार मशीन सीखने एल्गोरिथ्म का उपयोग करेंगे जो वेक्टर वर्गीकरण का समर्थन करता है। एसवीएम वेक्टर मशीन एक अविश्वसनीय रूप से शक्तिशाली विधि है जो रिग्रेशन और वर्गीकरण कार्यों को हल करने के लिए है।

  • SVM समर्थित वेक्टर

एसवीएम वेक्टर मशीन इस विचार पर आधारित है कि हम p-वर्ग विशेषताओं के लिए सुपरप्लेन स्पेस का उपयोग कर वर्गीकरण कर सकते हैं। एसवीएम वेक्टर मशीन एल्गोरिथ्म एक सुपरप्लेन और एक पहचान मार्जिन का उपयोग करता है वर्गीकरण निर्णय सीमा बनाने के लिए, जैसा कि नीचे दिखाया गया है।

क्या आप एसवीएम वेक्टर मशीनों के साथ दांव लगाकर (व्यापार करके) गोरिल्लाओं से आगे निकल सकते हैं?

सबसे सरल स्थिति में, रैखिक वर्गीकरण संभव है। एल्गोरिदम ने निर्णय सीमा का चयन किया है, जो कक्षाओं के बीच की दूरी को अधिकतम कर सकता है।

अधिकांश वित्तीय समय-क्रमों में, आपको सरल, रैखिक रूप से अलग-अलग सेटों का सामना करने की संभावना नहीं है, लेकिन अक्सर ऐसा होता है कि वे अलग-अलग नहीं होते हैं। एसवीएम वेक्टर मशीन ने इस समस्या को हल करने के लिए एक विधि लागू की है जिसे सॉफ्ट मार्जिन विधि कहा जाता है।

इस मामले में, कुछ गलत वर्गीकरण की स्थिति की अनुमति है, लेकिन वे स्वयं फ़ंक्शन को निष्पादित करते हैं ताकि सी के साथ सकारात्मक अनुपात हो सके (लागत या बजट की त्रुटि की अनुमति दी जा सकती है) और सीमा से त्रुटि की दूरी को कम से कम करने के लिए।

क्या आप एसवीएम वेक्टर मशीनों के साथ दांव लगाकर (व्यापार करके) गोरिल्लाओं से आगे निकल सकते हैं?

मूल रूप से, मशीन वर्गीकरण के बीच की दूरी को अधिकतम करने की कोशिश करती है और अपने C-भारित दंड को कम करने की कोशिश करती है।

एसवीएम वर्गीकरणकर्ता की एक अच्छी विशेषता यह है कि वर्गीकरण निर्णय सीमा का स्थान और आकार केवल उस डेटा के एक हिस्से द्वारा निर्धारित किया जाता है जो निर्णय सीमा से निकटतम है। इस तरह के एल्गोरिथ्म की विशेषताएं इसे दूर-दूर के असामान्य मानों के हस्तक्षेप का मुकाबला करने में सक्षम बनाती हैं। उदाहरण के लिए, ऊपर दिए गए आरेख में, सबसे दाईं ओर नीला बिंदु, निर्णय सीमा पर बहुत कम प्रभाव डालता है।

क्या यह बहुत जटिल है? ठीक है, मुझे लगता है कि मज़ा अभी शुरू हुआ है।

निम्नलिखित परिस्थितियों पर विचार करें (रेड डॉट्स को अन्य रंगों से अलग करें):

क्या आप एसवीएम वेक्टर मशीनों के साथ दांव लगाकर (व्यापार करके) गोरिल्लाओं से आगे निकल सकते हैं?

मानव के लिए, यह वर्गीकृत करने के लिए बहुत आसान है (एक गोलाकार रेखा के साथ) । लेकिन मशीनों के लिए एक ही नहीं है। यह स्पष्ट है कि यह एक सीधी रेखा नहीं है (एक सीधी रेखा लाल बिंदुओं को अलग नहीं कर सकती है) । यहाँ हम कर सकते हैं की कोशिश कर सकते हैं कील तंत्र की तकनीक (कील चाल) ।

इन-कोर तकनीक एक बहुत ही चतुर गणितीय तकनीक है जो हमें उच्च-आयामी अंतरिक्ष में रैखिक वर्गीकरण समस्याओं को हल करने में सक्षम बनाती है। अब हम देखेंगे कि यह कैसे किया जाता है।

हम दो-आयामी विशेषण स्थान को तीन-आयामी में बदल देंगे, और जब हम वर्गीकरण कर लेंगे तो हम दो-आयामी में वापस आ जाएंगे।

नीचे दिए गए चित्रों को क्रमशः बढ़ाया गया है और वर्गीकृत किया गया है:

क्या आप एसवीएम वेक्टर मशीनों के साथ दांव लगाकर (व्यापार करके) गोरिल्लाओं से आगे निकल सकते हैं?

आम तौर पर, यदि आपके पास d इनपुट है, तो आप d आयामी इनपुट स्पेस से p आयामी फीचर स्पेस तक एक मैप का उपयोग कर सकते हैं। ऊपर दिए गए न्यूनतमकरण एल्गोरिदम के समाधान को चलाएं, और फिर अपने मूल इनपुट स्पेस को p आयामी सुपरफ्लैट पर वापस मैप करें।

उपरोक्त गणितीय समाधान की एक महत्वपूर्ण शर्त यह है कि गुणों के स्थान में अच्छे बिंदु नमूना सेट कैसे उत्पन्न किए जाते हैं।

आपको केवल इन बिंदुओं के नमूना सेट की आवश्यकता होती है सीमा अनुकूलन करने के लिए, मानचित्रण को स्पष्ट करने की आवश्यकता नहीं है, और इनपुट स्पेस को सुरक्षित रूप से गणना की जा सकती है क्योंकि उच्च आयामी विशेषता स्पेस में बिंदुओं को कोर फ़ंक्शन ((और कुछ हद तक मर्सर प्रमेय की मदद से)) के माध्यम से गणना की जा सकती है।

उदाहरण के लिए, आप अपने वर्गीकरण समस्या को एक विशाल विशेषता अंतरिक्ष में हल करना चाहते हैं, मान लें कि यह 100,000 आयाम है। क्या आप कल्पना कर सकते हैं कि आपको क्या गणना करने की आवश्यकता होगी? मुझे बहुत संदेह है कि आप इसे पूरा कर पाएंगे। ठीक है, कोरल अब आपको इन बिंदुओं के नमूने की गणना करने देता है, इसलिए यह किनारा आपके कम एकाग्रता वाले आरामदायक इनपुट स्पेस से आता है।

  • चुनौती और गोरिल्ला

अब हम जेफ की भविष्यवाणी को हराने की चुनौती के लिए तैयार हैं।

जेफ एक मुद्रा बाजार विशेषज्ञ है और वह 50% पूर्वानुमान सटीकता के लिए रैंडम दांव लगाता है, जो अगले ट्रेडिंग दिन के रिटर्न की भविष्यवाणी करने के लिए एक संकेत है।

हम अलग-अलग बुनियादी समय अनुक्रमों का उपयोग करेंगे, जिसमें वास्तविक मूल्य समय अनुक्रम शामिल हैं, प्रत्येक समय अनुक्रम में 10lags तक की कमाई, कुल 55 विशेषताएं।

हम एक एसवीएम वेक्टर बनाने जा रहे हैं जो 3 डिग्री के कोर का उपयोग करता है। आप सोच सकते हैं कि एक उपयुक्त कोर चुनना एक और बहुत कठिन कार्य है। C और Γ पैरामीटर को कैलिब्रेट करने के लिए, 3 गुना क्रॉस-वैलिडेशन संभव पैरामीटर संयोजन के ग्रिड पर चलता है, और सबसे अच्छा सेट चुना जाएगा।

परिणाम बहुत उत्साहजनक नहीं हैं:

क्या आप एसवीएम वेक्टर मशीनों के साथ दांव लगाकर (व्यापार करके) गोरिल्लाओं से आगे निकल सकते हैं?

हम देख सकते हैं कि या तो रैखिक प्रतिगमन या एसवीएम वेक्टर जेफ को हरा सकते हैं। हालांकि परिणाम आशावादी नहीं हैं, हम डेटा से कुछ जानकारी प्राप्त कर सकते हैं, जो अच्छी खबर है, क्योंकि डेटा विषयों में, वित्तीय समय अनुक्रम दैनिक लाभ सबसे उपयोगी नहीं है

क्रॉस-सत्यापन के बाद, डेटासेट को प्रशिक्षित और परीक्षण किया जाएगा, हम प्रशिक्षित एसवीएम की पूर्वानुमान क्षमता को रिकॉर्ड करते हैं, और एक स्थिर प्रदर्शन के लिए, हम प्रत्येक मुद्रा के लिए 1000 बार यादृच्छिक विभाजन दोहराएंगे।

क्या आप एसवीएम वेक्टर मशीनों के साथ दांव लगाकर (व्यापार करके) गोरिल्लाओं से आगे निकल सकते हैं?

इस प्रकार, कुछ स्थितियों में, एसवीएम सरल रैखिक प्रतिगमन से बेहतर है, लेकिन प्रदर्शन में अंतर थोड़ा अधिक है। उदाहरण के लिए, डॉलर बनाम येन के लिए, हमारे औसत अनुमानित संकेत कुल आवृत्तियों का 54% हैं। यह एक काफी अच्छा परिणाम है, लेकिन चलो इसे और अधिक बारीकी से देखें!

टेड जेफ का चचेरा भाई है, और वह निश्चित रूप से एक गोरापिड है, लेकिन वह जेफ से अधिक बुद्धिमान है। टेड को प्रशिक्षण के नमूने पर ध्यान देना चाहिए, न कि बेतरतीब सट्टेबाजी पर। वह हमेशा प्रशिक्षण सेट के सबसे आम आउटपुट से संकेत देता है। चलो अब स्मार्ट टेड को एक बेंचमार्क के रूप में लेते हैंः

क्या आप एसवीएम वेक्टर मशीनों के साथ दांव लगाकर (व्यापार करके) गोरिल्लाओं से आगे निकल सकते हैं?

जैसा कि हम देख सकते हैं, अधिकांश एसवीएम का प्रदर्शन केवल इस तथ्य से संबंधित है कि मशीन सीखने के लिए वर्गीकरण की संभावना नहीं है कि यह पूर्वगामी के बराबर हो। वास्तव में, रैखिक प्रतिगमन विशेषता अंतरिक्ष से कोई जानकारी प्राप्त नहीं कर सकता है, लेकिन इंटरसेप्ट () रिटर्न में सार्थक है, और यह तथ्य कि इंटरसेप्ट और किसी विशेष वर्गीकरण को बेहतर प्रदर्शन करने के लिए बेहतर है।

थोड़ी अच्छी खबर यह है कि एसवीएम वेक्टर डेटा से कुछ अतिरिक्त गैर-रैखिक जानकारी प्राप्त करने में सक्षम है, जो हमें 2% की भविष्यवाणी की सटीकता का सुझाव दे सकता है।

दुर्भाग्य से, हम अभी तक यह नहीं जानते हैं कि यह किस तरह की जानकारी हो सकती है, जैसे कि एसवीएम वेक्टर मशीनों के अपने प्रमुख नुकसान हैं, जिन्हें हम स्पष्ट रूप से स्पष्ट नहीं कर सकते हैं।

लेखक: पी. लोपेज़, quantdare में प्रकाशित WeChat के पब्लिक नंबर से पुनर्प्रकाशित क्या आप एसवीएम वेक्टर मशीनों के साथ दांव लगाकर (व्यापार करके) गोरिल्लाओं से आगे निकल सकते हैं?