संसाधन लोड हो रहा है... लोड करना...

मशीन लर्निंग पर आधारित ऑर्डर बुक उच्च आवृत्ति व्यापार रणनीति

लेखक:आविष्कारक मात्रा - छोटे सपने, बनाया गयाः 2016-11-16 16:52:38, अद्यतन किया गयाः 2016-11-16 16:55:18

मशीन लर्निंग पर आधारित ऑर्डर बुक उच्च आवृत्ति व्यापार रणनीति

  • पहली बात

    प्रतिभूति बाजार के व्यापार तंत्र को बोली-संचालित बाजार और आदेश-संचालित बाजार के रूप में विभाजित किया जा सकता है, जो कि बाजार के माध्यम से तरलता प्रदान करने के लिए बाज़ारिया पर निर्भर करता है, जो कि सीमा शुल्क के माध्यम से तरलता प्रदान करता है, जो कि निवेशकों द्वारा खरीद और बिक्री के लिए बोली लगाने के माध्यम से होता है। चीन का प्रतिभूति बाजार एक आदेश-संचालित बाजार है, जिसमें शेयर बाजार और वायदा बाजार शामिल हैं।

    imgचित्र 1 ऑर्डर ड्राइव बाजार का ग्राफ

    • (i) सीमित मूल्य सूची के लिए आदेश पुस्तिका परिचय

      ऑर्डर बुक का अध्ययन बाजार की सूक्ष्म संरचना के अध्ययन की श्रेणी में आता है, बाजार की सूक्ष्म संरचना सिद्धांत सूक्ष्म अर्थशास्त्र में मूल्य सिद्धांत और निर्माता सिद्धांत के रूप में अपने विचारों का स्रोत है, जबकि इसके मूल प्रश्नों के विश्लेषण में वित्तीय परिसंपत्तियों के लेनदेन और उनके मूल्य निर्माण की प्रक्रिया और कारणों के लिए सामान्य संतुलन, स्थानीय संतुलन, सीमांत लाभ, सीमांत लागत, बाजार निरंतरता, स्टॉक सिद्धांत, गेम थ्योरी, सूचना अर्थशास्त्र और अन्य कई सिद्धांतों और तरीकों का उपयोग किया जाता है।

      विदेशी शोध के अनुसार, बाजार के सूक्ष्म संरचना के क्षेत्र में ओ हारा का प्रतिनिधित्व किया गया है, जिसमें अधिकांश सिद्धांत बाजार-प्रेरित बाजारों (यानी बोली-चालित बाजारों) पर आधारित हैं, जैसे कि स्टॉक मॉडल और सूचना मॉडल आदि। इस वर्ष, वास्तविक लेनदेन बाजारों में, ऑर्डर-ड्राइविंग धीरे-धीरे ऊपर आ गया है, लेकिन ऑर्डर-ड्राइविंग बाजारों के लिए विशेष रूप से कम अध्ययन किया गया है।

      घरेलू शेयर बाजार और फ्यूचर्स बाजार दोनों ऑर्डर ड्राइव बाजार हैं, नीचे दी गई छवि स्टॉक इंडेक्स फ्यूचर्स कॉन्ट्रैक्ट आईएफ 1312 के लेवल_1 इंडस्ट्री ऑर्डर बुक की स्क्रीनशॉट है। ऊपर से सीधे प्राप्त जानकारी बहुत अधिक नहीं है, बुनियादी जानकारी में एक खरीद मूल्य, एक बिक्री मूल्य, एक खरीद मात्रा और एक बिक्री मात्रा शामिल है। कुछ विदेशी अकादमिक लेखों में, ऑर्डर बुक के अनुरूप एक सूचना पुस्तिका भी है, जिसमें सबसे विस्तृत ऑर्डर फ़ोटोग्राफ डेटा शामिल है, जिसमें प्रत्येक ऑर्डर की मात्रा, डिलिवरी मूल्य, ऑर्डर प्रकार आदि शामिल हैं, क्योंकि घरेलू बाजार में सूचना पुस्तिका सार्वजनिक नहीं है, इसलिए हम केवल ऑर्डर बुक पर भरोसा कर सकते हैं।

      imgचित्रा 2 स्टॉक इंडेक्स फ्यूचर्स मुख्य अनुबंध स्तर -1 ऑर्डर बुक

    • (बी) ऑर्डर बुक उच्च आवृत्ति लेनदेन अनुसंधान प्रगति

      ऑर्डर बुक के गतिशील मॉडलिंग के दो मुख्य तरीके हैं, एक शास्त्रीय मापन अर्थशास्त्र और दूसरा मशीन सीखने का तरीका। मापन अर्थशास्त्र का तरीका एक शास्त्रीय मुख्यधारा का शोध है, जैसे कि मूल्य अंतर विश्लेषण के लिए एमआरआर विश्लेषण, ह्वांग और स्टॉल विश्लेषण, ऑर्डर अवधि के लिए एसीडी मॉडल और मूल्य पूर्वानुमान के लिए लॉजिस्टिक मॉडल।

      मशीनी शिक्षा के लिए वित्तीय क्षेत्र में शैक्षणिक अनुसंधान भी बहुत सक्रिय है, उदाहरण के लिए 2012 में फ्यूजForecasting trends of high_frequency KOSPI200 index data using learning classifiers फ्यूज एक आम शोध विचार है, जो तकनीकी विश्लेषण के सामान्य संकेतकों (MA, EMA, RSI आदि) का उपयोग करके बाजार की भविष्यवाणी करने के लिए मशीन सीखने के वर्गीकरण विधियों को पेश करता है। लेकिन यह अभ्यास ऑर्डर बही गतिशीलता की जानकारी को खोदने के लिए अपर्याप्त है, अर्थात, ऑर्डर बही गतिशीलता की जानकारी का उपयोग करके उच्च उतार-चढ़ाव के लिए व्यापार करने के लिए अध्ययन देश और विदेश में अपेक्षाकृत कम है, यह एक गहराई से अध्ययन के लायक क्षेत्र है।

  • 2. ऑर्डर बुक में उच्च आवृत्ति लेनदेन में मशीन सीखने का उपयोग

    • (i) सिस्टम आर्किटेक्चर

      नीचे दिए गए चित्र में एक विशिष्ट मशीन सीखने की ट्रेडिंग रणनीति के लिए एक सिस्टम आर्किटेक्चर है, जिसमें ऑर्डर बुक डेटा, विशेषता खोज, मॉडल निर्माण और सत्यापन और ट्रेडिंग अवसर के कुछ प्रमुख मॉड्यूल शामिल हैं। यह ध्यान देने योग्य है कि ट्रेडिंग प्रक्रिया बाजार की घटनाओं द्वारा शुरू की जाती है, जिसमें टिक बाजार का आगमन एक है।

      imgचित्र 3 मशीन सीखने पर आधारित ऑर्डर बुक मॉडलिंग के लिए सिस्टम आर्किटेक्चर

    • (२) वेक्टर मशीन का परिचय

      1970 के दशक में, वापनिक और अन्य लोगों ने सांख्यिकीय सीखने के सिद्धांत (एसएलटी) का निर्माण करना शुरू किया, जो सीमित नमूना परिस्थितियों में सांख्यिकीय नियम और सीखने के तरीकों की प्रकृति का अध्ययन करने के लिए उपयोग किया जाता है, सीमित नमूना मशीन सीखने की समस्याओं के लिए एक अच्छा सैद्धांतिक ढांचा स्थापित करता है, जो छोटे नमूने, गैर-रैखिक, उच्च आयामी संख्याओं और स्थानीय अतिसूक्ष्म बिंदुओं जैसे वास्तविक समस्याओं को बेहतर ढंग से हल करता है। 1995 में, वापनिक और अन्य लोगों ने एक नया सामान्य सीखने का तरीका स्पष्ट रूप से पेश किया, जो कि व्यापक रूप से ध्यान दिया गया था और विभिन्न क्षेत्रों में लागू किया गया था।

      एसवीएम रैखिक रूप से विभाज्य स्थितियों में सबसे अच्छा वर्गीकरण सुपरप्लेन से विकसित होता है। दो प्रकार के वर्गीकरण समस्याओं के लिए, प्रशिक्षण नमूना सेट को ((xi,yi), i = 1,2...l, l के रूप में सेट किया जाता है, प्रशिक्षण नमूना के लिए इकाइयों की संख्या, और प्रशिक्षण नमूना के लिए xi, yi के लिए {-1+,1} इनपुट नमूना xi के लिए एक वर्ग चिह्न ((अपेक्षित आउटपुट) है। एसवीएम एल्गोरिथ्म सबसे अच्छा वर्गीकरण सुपरप्लेन खोजने के लिए शुरू होता है।

      इष्टतम वर्गीकरण सुपरफ्लैट न केवल सभी नमूनों को सही ढंग से अलग करने में सक्षम है (प्रशिक्षण त्रुटि स्कोर 0 है), बल्कि दोनों वर्गों के बीच सबसे बड़ा मार्जिन बनाने में भी सक्षम है, जिसे प्रशिक्षण डेटासेट से उस वर्गीकरण सुपरफ्लैट की न्यूनतम दूरी के योग के रूप में परिभाषित किया गया है। इष्टतम वर्गीकरण सुपरफ्लैट का अर्थ है कि परीक्षण डेटा के लिए औसत वर्गीकरण त्रुटि सबसे कम है।

      यदि d-dimensional vector space में एक सुपरफ्लैट है:

      F(x) = w*x+b=0

      उपरोक्त दो प्रकार के डेटा को अलग करने में सक्षम होने के लिए, इस सुपरप्लेन को एक विभाजन इंटरफ़ेस कहा जाता है; जहां w * x दो वेक्टरों w और x के आंतरिक भागों को d-dimensional vector space में है।

      यदि इंटरफ़ेस को विभाजित करेंः

      w*x+b=0

      जिस अंतर (मार्जिन) से अंतर (मार्जिन) सबसे अधिक हो, उस अंतर को सबसे अच्छा अंतर कहा जाता है।

      imgचित्रा 4 SVM द्विआधारीकरण के सबसे अच्छे अंतरफलक का नक्शा

      सबसे अच्छा अंतरण इंटरफ़ेस समीकरण के लिए एकीकरण, जो दो प्रकार के नमूनों के बीच की दूरी को बढ़ा सकता है

      img

      तो किसी भी नमूने के लिए,

      img

      सबसे अच्छा इंटरफ़ेस प्राप्त करने के लिए, उपरोक्त सूत्रों को पूरा करने के अलावा, इसे कम से कम करना होगा।

      इस प्रकार, एसवीएम समस्या का गणितीय मॉडल हैःimg

      एसवीएम अंततः सबसे अनुकूलित योजना समस्या बन गई, और अकादमिक अनुसंधान का मुख्य रूप से तेजी से समाधान, बहु-श्रेणी में प्रचार, व्यावहारिक समस्या अनुप्रयोग आदि पर ध्यान केंद्रित किया गया।

      एसवीएम मूल रूप से द्वि-वर्गीकरण समस्याओं के लिए था और वर्तमान व्यावहारिक अनुप्रयोगों की आवश्यकताओं के आधार पर बहु-वर्गीकरण समस्याओं के लिए भी इसका विस्तार किया गया है। पहले से मौजूद बहु-वर्गीकरण एल्गोरिदम में एक-पर-एक, एक-पर-एक, त्रुटि-संकेतन, डीएजी-एसवीएम और मल्टी-आई-क्लास एसवीएम वर्गीकरण आदि शामिल हैं।

    • (iii) ऑर्डर बुक के संकेतकों को निकालना

      स्टॉक इंडेक्स फ्यूचर्स लेवल-1 के उदाहरण के रूप में, ऑर्डर बुक में मुख्य रूप से एक खरीद, बिक्री, खरीद, बिक्री आदि बुनियादी संकेतकों को शामिल किया गया है, और गहराई, स्प्लिट, सापेक्ष मूल्य अंतर जैसे संकेतकों को व्युत्पन्न किया जा सकता है, अन्य संकेतकों में होल्डिंग्स, लेनदेन, सीमांकन आदि शामिल हैं, कुल मिलाकर 17 संकेतकों के लिए, जैसा कि नीचे दी गई तालिका में दिखाया गया है।

      तालिका 1 लेवल बाजार ऑर्डर बुक पर आधारित संकेतक

      img

    • (४) ऑर्डर बुक की गतिशील विशेषताएं और लेनदेन के अवसर

      बाजार के सूक्ष्म दृष्टिकोण से, कम समय में मूल्य गति को मापने के दो तरीके हैं, एक मध्य मूल्य गति है, और दूसरा मूल्य अंतर क्रॉस है। इस लेख में अधिक सरल और सहज मध्य मूल्य गति का चयन किया गया है। मध्य मूल्य की परिभाषाः

      img

      आदेश पुस्तिका के अनुसार, मध्य मूल्य ΔT में ΔP परिवर्तनों को तीन श्रेणियों में विभाजित किया गया है।

      नीचे दिया गया चार्ट 29 अक्टूबर को मुख्य अनुबंध IF1311 के मध्य मूल्य आंदोलन का वितरण है, जिसमें 32400 दैनिक टिक बाजार डेटा हैं।

      Δt = 1 टिक के मामले में, मध्य मूल्य में 0.2 का पूर्ण परिवर्तन लगभग 6000 बार, 0.4 का पूर्ण परिवर्तन लगभग 1500 बार, 0.6 का पूर्ण परिवर्तन लगभग 150 बार, 0.8 का पूर्ण परिवर्तन लगभग 50 बार, और 1 से 10 बार बड़ा होता है।

      Δt = 2tick के मामले में, मध्य मूल्य में 0.2 का पूर्ण परिवर्तन लगभग 7000 बार, 0.4 का पूर्ण परिवर्तन लगभग 3000 बार, 0.6 का पूर्ण परिवर्तन लगभग 550 बार, 0.8 का पूर्ण परिवर्तन लगभग 205 बार, और 1 से अधिक का पूर्ण परिवर्तन लगभग 10 बार होता है।

      हम मानते हैं कि यदि परिवर्तन का पूर्ण मूल्य 0.4 से अधिक है, तो यह एक संभावित व्यापारिक अवसर है। यदि Δt = 1 टिक है, तो प्रति दिन लगभग 1700 अवसर हैं; यदि Δt = 2 टिक है, तो प्रति दिन लगभग 4000 अवसर हैं।

      img

      चित्रा 5 IF1311 मध्य मूल्य में 29 अक्टूबर को हुए बदलाव का सारण ((Δt=1 tick)

      img

      चित्रा 6 IF1311 मध्य मूल्य परिवर्तन का 29 अक्टूबर का सारण ((Δt=2tick)

  • तीन, रणनीतिक प्रमाण

    क्योंकि एसवीएम मॉडल में बड़ी नमूना स्थितियों में प्रशिक्षण की जटिलता अधिक होती है और प्रशिक्षण का समय लंबा होता है, इसलिए हमने आईएफ 1311 अनुबंध के अक्टूबर में लेवल_1 बाजार डेटा के साथ मॉडल की प्रभावशीलता को सत्यापित करने के लिए अपेक्षाकृत कम अवधि के लिए ऐतिहासिक बाजार डेटा का चयन किया।

    • (i) मॉडल प्रभाव परीक्षण

      डेटा चक्रः अक्टूबर में IF1311 अनुबंध बाजार के आंकड़े;

      Δt मूल्य निर्धारणः Δt जितना छोटा होगा, लेनदेन के विवरण पर उतनी ही अधिक आवश्यकता होगी, जब Δt = 1 टिक, वास्तविक लेनदेन में लाभ प्राप्त करना मुश्किल होगा। मॉडल के प्रभाव को तुलना करने के लिए, यहां क्रमशः 1 टिक, 2 टिक, 3 टिक का मूल्य निर्धारण किया गया है।

      मॉडल के मूल्यांकन के संकेतकों में नमूना सटीकता, परीक्षण सटीकता, भविष्यवाणी समय शामिल हैं।imgतालिका 2 1 टिक डेटा के साथ 1 टिक के प्रभाव का अनुमान लगाती है

      imgतालिका 3 1 टिक डेटा के साथ 2 टिक के प्रभाव का अनुमान लगाती है

      imgतालिका 4 2tick डेटा के साथ 2tick के प्रभाव का पूर्वानुमान

      इन तीन तालिकाओं के आंकड़ों से, हम निम्नलिखित निष्कर्ष निकाल सकते हैंः उच्चतम सटीकता लगभग 70% है, और 60% सटीकता में, इसे व्यापार रणनीति में बदल दिया जा सकता है।

    • (२) रणनीतिक प्रतिरूपण लाभ

      उदाहरण के लिए, 31 अक्टूबर को, हम एक एनालॉग ट्रेडिंग करते हैं, एक संस्था का स्टॉक फ्यूचर्स ट्रेडिंग शुल्क आमतौर पर 0.26/10000 होता है। हम मानते हैं कि ट्रेडिंग की संख्या में कोई सीमा नहीं है। हम मानते हैं कि प्रत्येक ट्रेड के लिए एकतरफा स्लाइड मूल्य 0.2 अंक है और प्रत्येक एकल हाथ की संख्या 1 है।

      तालिका 5 31 अक्टूबर को लेनदेन के लिए एनालॉग रणनीतिimg

      दिन भर में 605 बार कारोबार किया गया, प्रक्रियाओं को शामिल किया गया, 339 बार लाभ हुआ, जीत का प्रतिशत 56%, शुद्ध लाभ 11814.99 युआन।

      सैद्धांतिक रूप से, स्लाइड मूल्य 145,520 युआन है, जो रणनीतिक वास्तविक युद्ध के लिए महत्वपूर्ण है। यदि आदेश विवरण को अधिक बारीकी से नियंत्रित किया जाता है, तो स्लाइड मूल्य को कम किया जा सकता है और शुद्ध लाभ में वृद्धि की जा सकती है। यदि आदेश विवरण को अनुचित रूप से नियंत्रित किया जाता है, या बाजार में उतार-चढ़ाव असामान्य है, तो स्लाइड मूल्य अधिक होगा, जबकि शुद्ध लाभ कम होगा। इसलिए उच्च आवृत्ति व्यापार की सफलता अक्सर विवरण के निष्पादन पर निर्भर करती है।

      चित्र 7 31 अक्टूबर को एनालॉग रणनीतियों के लाभimg

मूल कथनः इस लेख के लेखक के लिए मूल, कृपया स्रोत का उल्लेख करें।


अधिक

ईवन1987गुडविन, सीख रही हैं कि कैसे ऑर्डर बीन का अध्ययन किया जाए