मशीन लर्निंग पर आधारित ऑर्डर बुक उच्च आवृत्ति व्यापार रणनीति

लेखक:आविष्कारक मात्रा - छोटे सपने, बनाया गयाः 2016-11-16 16:52:38, अद्यतन किया गयाः 2016-11-16 16:55:18

मशीन लर्निंग पर आधारित ऑर्डर बुक उच्च आवृत्ति व्यापार रणनीति

  • ### एक, शिथिलता प्रतिभूति बाजार के व्यापार तंत्र को बोली-संचालित बाजार और आदेश-संचालित बाजार के रूप में विभाजित किया जा सकता है, जो कि बाजार के माध्यम से तरलता प्रदान करने वाले बाज़ारियों पर निर्भर करता है, जो कि सीमा शुल्क सूचियों के माध्यम से तरलता प्रदान करता है, जो कि निवेशकों द्वारा खरीद और बिक्री के लिए बोली लगाने के माध्यम से होता है। चीन का प्रतिभूति बाजार एक आदेश-संचालित बाजार है, जिसमें शेयर बाजार और वायदा बाजार शामिल हैं।

基于机器学习的订单簿高频交易策略चित्र 1 ऑर्डर ड्राइव बाजार का ग्राफ

  • (i) सीमित मूल्य सूची के लिए आदेश पुस्तिका परिचय

    ऑर्डर बुक का अध्ययन बाजार की सूक्ष्म संरचना के अध्ययन की श्रेणी में आता है, बाजार की सूक्ष्म संरचना सिद्धांत सूक्ष्म अर्थशास्त्र में मूल्य सिद्धांत और निर्माता सिद्धांत के रूप में अपने विचारों का स्रोत है, जबकि इसके मूल प्रश्नों के विश्लेषण में वित्तीय परिसंपत्तियों के लेनदेन और उनके मूल्य निर्माण की प्रक्रिया और कारणों के लिए सामान्य संतुलन, स्थानीय संतुलन, सीमांत लाभ, सीमांत लागत, बाजार निरंतरता, स्टॉक सिद्धांत, गेम थ्योरी, सूचना अर्थशास्त्र और अन्य कई सिद्धांतों और तरीकों का उपयोग किया जाता है।

    विदेशी शोध के अनुसार, बाजार के सूक्ष्म संरचना के क्षेत्र में ओ हारा का प्रतिनिधित्व किया गया है, जिसमें अधिकांश सिद्धांत बाजार-प्रेरित बाजारों (यानी बोली-चालित बाजारों) पर आधारित हैं, जैसे कि स्टॉक मॉडल और सूचना मॉडल आदि। इस वर्ष, वास्तविक लेनदेन बाजारों में, ऑर्डर-ड्राइविंग धीरे-धीरे ऊपर आ गया है, लेकिन ऑर्डर-ड्राइविंग बाजारों के लिए विशेष रूप से कम अध्ययन किया गया है।

    घरेलू शेयर बाजार और फ्यूचर्स बाजार दोनों ऑर्डर ड्राइव बाजार हैं, नीचे दी गई छवि स्टॉक इंडेक्स फ्यूचर्स कॉन्ट्रैक्ट आईएफ 1312 के लेवल_1 इंडस्ट्री ऑर्डर बुक की स्क्रीनशॉट है। ऊपर से सीधे प्राप्त जानकारी बहुत अधिक नहीं है, बुनियादी जानकारी में एक खरीद मूल्य, एक बिक्री मूल्य, एक खरीद मात्रा और एक बिक्री मात्रा शामिल है। कुछ विदेशी अकादमिक लेखों में, ऑर्डर बुक के अनुरूप एक सूचना पुस्तिका भी है, जिसमें सबसे विस्तृत ऑर्डर फ़ोटोग्राफ डेटा शामिल है, जिसमें प्रत्येक ऑर्डर की मात्रा, डिलिवरी मूल्य, ऑर्डर प्रकार आदि शामिल हैं, क्योंकि घरेलू बाजार में सूचना पुस्तिका सार्वजनिक नहीं है, इसलिए हम केवल ऑर्डर बुक पर भरोसा कर सकते हैं।

    基于机器学习的订单簿高频交易策略चित्रा 2 स्टॉक इंडेक्स फ्यूचर्स मुख्य अनुबंध स्तर -1 ऑर्डर बुक

  • (बी) ऑर्डर बुक उच्च आवृत्ति लेनदेन अनुसंधान प्रगति

    ऑर्डर बुक के गतिशील मॉडलिंग के दो मुख्य तरीके हैं, एक शास्त्रीय मापन अर्थशास्त्र और दूसरा मशीन सीखने का तरीका। मापन अर्थशास्त्र का तरीका एक शास्त्रीय मुख्यधारा का शोध है, जैसे कि मूल्य अंतर विश्लेषण के लिए एमआरआर विश्लेषण, ह्वांग और स्टॉल विश्लेषण, ऑर्डर अवधि के लिए एसीडी मॉडल और मूल्य पूर्वानुमान के लिए लॉजिस्टिक मॉडल।

    मशीनी शिक्षा के लिए वित्तीय क्षेत्र में शैक्षणिक अनुसंधान भी बहुत सक्रिय है, उदाहरण के लिए 2012 में फ्यूजForecasting trends of high_frequency KOSPI200 index data using learning classifiers फ्यूज एक आम शोध विचार है, जो तकनीकी विश्लेषण के सामान्य संकेतकों (MA, EMA, RSI आदि) का उपयोग करके बाजार की भविष्यवाणी करने के लिए मशीन सीखने के वर्गीकरण विधियों को पेश करता है। लेकिन यह अभ्यास ऑर्डर बही गतिशीलता की जानकारी को खोदने के लिए अपर्याप्त है, अर्थात, ऑर्डर बही गतिशीलता की जानकारी का उपयोग करके उच्च उतार-चढ़ाव के लिए व्यापार करने के लिए अध्ययन देश और विदेश में अपेक्षाकृत कम है, यह एक गहराई से अध्ययन के लायक क्षेत्र है।

  • 2. ऑर्डर बुक में उच्च आवृत्ति लेनदेन में मशीन सीखने का उपयोग

    • #### (1) सिस्टम आर्किटेक्चर नीचे दिए गए चित्र में एक विशिष्ट मशीन सीखने की ट्रेडिंग रणनीति के लिए एक सिस्टम आर्किटेक्चर है, जिसमें ऑर्डर बुक डेटा, विशेषता खोज, मॉडल निर्माण और सत्यापन और ट्रेडिंग अवसर के कुछ प्रमुख मॉड्यूल शामिल हैं। यह ध्यान देने योग्य है कि ट्रेडिंग प्रक्रिया बाजार घटनाओं द्वारा शुरू की जाती है, जिसमें टिक बाजार का आगमन एक है।

    基于机器学习的订单簿高频交易策略चित्र 3 मशीन सीखने पर आधारित ऑर्डर बुक मॉडलिंग के लिए सिस्टम आर्किटेक्चर

    • #### (बी) समर्थन वेक्टर मशीन परिचय 1970 के दशक में, वापनिक और अन्य लोगों ने सांख्यिकीय सीखने के सिद्धांत (एसएलटी) का निर्माण करना शुरू किया, जो सीमित नमूना परिस्थितियों में सांख्यिकीय नियम और सीखने के तरीकों की प्रकृति का अध्ययन करने के लिए उपयोग किया जाता है, सीमित नमूना मशीन सीखने की समस्याओं के लिए एक अच्छा सैद्धांतिक ढांचा स्थापित करता है, जो छोटे नमूने, गैर-रैखिक, उच्च आयामी संख्याओं और स्थानीय अतिसूक्ष्म बिंदुओं जैसे वास्तविक समस्याओं को बेहतर ढंग से हल करता है। 1995 में, वापनिक और अन्य लोगों ने एक नया सामान्य सीखने का तरीका स्पष्ट रूप से पेश किया, जो कि व्यापक रूप से ध्यान दिया गया था और विभिन्न क्षेत्रों में लागू किया गया था।

    एसवीएम रैखिक रूप से विभाज्य स्थितियों में सबसे अच्छा वर्गीकरण सुपरप्लेन से विकसित होता है। दो प्रकार के वर्गीकरण समस्याओं के लिए, प्रशिक्षण नमूना सेट को ((xi,yi), i = 1,2...l, l के रूप में सेट किया जाता है, प्रशिक्षण नमूना के लिए इकाइयों की संख्या, और प्रशिक्षण नमूना के लिए xi, yi के लिए {-1+,1} इनपुट नमूना xi के लिए एक वर्ग चिह्न ((अपेक्षित आउटपुट) है। एसवीएम एल्गोरिथ्म सबसे अच्छा वर्गीकरण सुपरप्लेन खोजने के लिए शुरू होता है।

    इष्टतम वर्गीकरण सुपरफ्लैट न केवल सभी नमूनों को सही ढंग से अलग करने में सक्षम है (प्रशिक्षण त्रुटि स्कोर 0 है), बल्कि दोनों वर्गों के बीच सबसे बड़ा मार्जिन बनाने में भी सक्षम है, जिसे प्रशिक्षण डेटासेट से उस वर्गीकरण सुपरफ्लैट की न्यूनतम दूरी के योग के रूप में परिभाषित किया गया है। इष्टतम वर्गीकरण सुपरफ्लैट का अर्थ है कि परीक्षण डेटा के लिए औसत वर्गीकरण त्रुटि सबसे कम है।

    यदि d-dimensional vector space में एक सुपरफ्लैट है:

    F(x) = w*x+b=0

    उपरोक्त दो प्रकार के डेटा को अलग करने में सक्षम होने के लिए, इस सुपरप्लेन को एक विभाजन इंटरफ़ेस कहा जाता है; जहां w * x दो वेक्टरों w और x के आंतरिक भागों को d-dimensional vector space में है।

    यदि इंटरफ़ेस को विभाजित करेंः

    w*x+b=0

    जिस अंतर (मार्जिन) से अंतर (मार्जिन) सबसे अधिक हो, उस अंतर को सबसे अच्छा अंतर कहा जाता है।

    基于机器学习的订单簿高频交易策略चित्रा 4 SVM द्विआधारीकरण के सबसे अच्छे अंतरफलक का नक्शा

    सबसे अच्छा अंतरण इंटरफ़ेस समीकरण के लिए एकीकरण, जो दो प्रकार के नमूनों के बीच की दूरी को बढ़ा सकता है

    基于机器学习的订单簿高频交易策略

    तो किसी भी नमूने के लिए,

    基于机器学习的订单簿高频交易策略

    सबसे अच्छा इंटरफ़ेस प्राप्त करने के लिए, उपरोक्त सूत्रों को पूरा करने के अलावा, इसे कम से कम करना होगा।

    इस प्रकार, एसवीएम समस्या का गणितीय मॉडल हैः基于机器学习的订单簿高频交易策略

    एसवीएम अंततः सबसे अनुकूलित योजना समस्या बन गई, और अकादमिक अनुसंधान का मुख्य रूप से तेजी से समाधान, बहु-श्रेणी में प्रचार, व्यावहारिक समस्या अनुप्रयोग आदि पर ध्यान केंद्रित किया गया।

    एसवीएम मूल रूप से द्वि-वर्गीकरण समस्याओं के लिए था और वर्तमान व्यावहारिक अनुप्रयोगों की आवश्यकताओं के आधार पर बहु-वर्गीकरण समस्याओं के लिए भी इसका विस्तार किया गया है। पहले से मौजूद बहु-वर्गीकरण एल्गोरिदम में एक-पर-एक, एक-पर-एक, त्रुटि-संकेतन, डीएजी-एसवीएम और मल्टी-आई-क्लास एसवीएम वर्गीकरण आदि शामिल हैं।

    • #### (३) ऑर्डर बुक सूचकांक निकालना स्टॉक इंडेक्स फ्यूचर्स लेवल-1 के उदाहरण के रूप में, ऑर्डर बुक में मुख्य रूप से एक खरीद, बिक्री, खरीद, बिक्री आदि बुनियादी संकेतकों को शामिल किया गया है, और गहराई, स्प्लिट, सापेक्ष मूल्य अंतर जैसे संकेतकों को व्युत्पन्न किया जा सकता है, अन्य संकेतकों में होल्डिंग, लेनदेन, सीमांकन आदि शामिल हैं, कुल मिलाकर 17 संकेतकों को शामिल किया गया है, जैसा कि नीचे दी गई तालिका में दिखाया गया है।

    तालिका 1 लेवल बाजार ऑर्डर बुक पर आधारित संकेतक

    基于机器学习的订单簿高频交易策略

    • #### (४) ऑर्डर बुक की गतिशील विशेषताएं और सौदे के अवसर बाजार के सूक्ष्म दृष्टिकोण से, कम समय में मूल्य गति को मापने के दो तरीके हैं, एक मध्य मूल्य गति और दूसरा मूल्य अंतर क्रॉस। इस लेख में अधिक सरल और सहज मध्य मूल्य गति का चयन किया गया है। मध्य मूल्य की परिभाषाः

    基于机器学习的订单簿高频交易策略

    आदेश पुस्तिका के अनुसार, मध्य मूल्य ΔT में ΔP परिवर्तनों को तीन श्रेणियों में विभाजित किया गया है।

    नीचे दिया गया चार्ट 29 अक्टूबर को मुख्य अनुबंध IF1311 के मध्य मूल्य आंदोलन का वितरण है, जिसमें 32400 दैनिक टिक बाजार डेटा हैं।

    Δt = 1 टिक के मामले में, मध्य मूल्य में 0.2 का पूर्ण परिवर्तन लगभग 6000 बार, 0.4 का पूर्ण परिवर्तन लगभग 1500 बार, 0.6 का पूर्ण परिवर्तन लगभग 150 बार, 0.8 का पूर्ण परिवर्तन लगभग 50 बार, और 1 से 10 बार बड़ा होता है।

    Δt = 2tick के मामले में, मध्य मूल्य में 0.2 का पूर्ण परिवर्तन लगभग 7000 बार, 0.4 का पूर्ण परिवर्तन लगभग 3000 बार, 0.6 का पूर्ण परिवर्तन लगभग 550 बार, 0.8 का पूर्ण परिवर्तन लगभग 205 बार, और 1 से अधिक का पूर्ण परिवर्तन लगभग 10 बार होता है।

    हम मानते हैं कि यदि परिवर्तन का पूर्ण मूल्य 0.4 से अधिक है, तो यह एक संभावित व्यापारिक अवसर है। यदि Δt = 1 टिक है, तो प्रति दिन लगभग 1700 अवसर हैं; यदि Δt = 2 टिक है, तो प्रति दिन लगभग 4000 अवसर हैं।

    基于机器学习的订单簿高频交易策略

    चित्रा 5 IF1311 मध्य मूल्य में 29 अक्टूबर को हुए बदलाव का सारण ((Δt=1 tick)

    基于机器学习的订单簿高频交易策略

    चित्रा 6 IF1311 मध्य मूल्य परिवर्तन का 29 अक्टूबर का सारण ((Δt=2tick)

  • तीन, रणनीतिक प्रमाण

    क्योंकि एसवीएम मॉडल में बड़ी नमूना स्थितियों में प्रशिक्षण की जटिलता अधिक होती है और प्रशिक्षण का समय लंबा होता है, इसलिए हमने आईएफ 1311 अनुबंध के अक्टूबर में लेवल_1 बाजार डेटा के साथ मॉडल की प्रभावशीलता को सत्यापित करने के लिए अपेक्षाकृत कम अवधि के लिए ऐतिहासिक बाजार डेटा का चयन किया।

    • #### (1) मॉडल प्रभाव परीक्षण डेटा चक्रः अक्टूबर में IF1311 अनुबंध बाजार के आंकड़े;

    Δt मूल्य निर्धारणः Δt जितना छोटा होगा, लेनदेन के विवरण पर उतनी ही अधिक आवश्यकता होगी, जब Δt = 1 टिक, वास्तविक लेनदेन में लाभ प्राप्त करना मुश्किल होगा। मॉडल के प्रभाव को तुलना करने के लिए, यहां क्रमशः 1 टिक, 2 टिक, 3 टिक का मूल्य निर्धारण किया गया है।

    मॉडल के मूल्यांकन के संकेतकों में नमूना सटीकता, परीक्षण सटीकता, भविष्यवाणी समय शामिल हैं।基于机器学习的订单簿高频交易策略तालिका 2 1 टिक डेटा के साथ 1 टिक के प्रभाव का अनुमान लगाती है

    基于机器学习的订单簿高频交易策略तालिका 3 1 टिक डेटा के साथ 2 टिक के प्रभाव का अनुमान लगाती है

    基于机器学习的订单簿高频交易策略तालिका 4 2tick डेटा के साथ 2tick के प्रभाव का पूर्वानुमान

    इन तीन तालिकाओं के आंकड़ों से, हम निम्नलिखित निष्कर्ष निकाल सकते हैंः उच्चतम सटीकता लगभग 70% है, और 60% सटीकता में, इसे व्यापार रणनीति में बदल दिया जा सकता है।

    • ######################### उदाहरण के लिए, 31 अक्टूबर को, हम एक एनालॉग ट्रेडिंग करते हैं, जहां संस्था के शेयरों के लिए वायदा ट्रेडिंग की प्रक्रिया शुल्क आमतौर पर 0 होता है।2610000, हम मानते हैं कि ट्रेडों की संख्या में कोई सीमा नहीं है, हम मानते हैं कि प्रत्येक ट्रेड के लिए एकतरफा स्लाइड मूल्य 0.2 अंक है, और प्रत्येक एकल हाथ के लिए एक हाथ है।

    तालिका 5 31 अक्टूबर को लेनदेन के लिए एनालॉग रणनीति基于机器学习的订单簿高频交易策略

    दिन भर में 605 बार कारोबार किया गया, प्रक्रियाओं को शामिल किया गया, 339 बार लाभ हुआ, जीत का प्रतिशत 56%, शुद्ध लाभ 11814.99 युआन।

    सैद्धांतिक रूप से, स्लाइड मूल्य 145,520 युआन है, जो रणनीतिक वास्तविक युद्ध के लिए महत्वपूर्ण है। यदि आदेश विवरण को अधिक बारीकी से नियंत्रित किया जाता है, तो स्लाइड मूल्य को कम किया जा सकता है और शुद्ध लाभ में वृद्धि की जा सकती है। यदि आदेश विवरण को अनुचित रूप से नियंत्रित किया जाता है, या बाजार में उतार-चढ़ाव असामान्य है, तो स्लाइड मूल्य अधिक होगा, जबकि शुद्ध लाभ कम होगा। इसलिए उच्च आवृत्ति व्यापार की सफलता अक्सर विवरण के निष्पादन पर निर्भर करती है।

    चित्र 7 31 अक्टूबर को एनालॉग रणनीतियों के लाभ基于机器学习的订单簿高频交易策略

मूल कथनः इस लेख के लेखक के लिए मूल, कृपया स्रोत का उल्लेख करें।


अधिक जानकारी

ईवन1987गुडविन, सीख रही हैं कि कैसे ऑर्डर बीन का अध्ययन किया जाए