यह लेख सामने लिखा हैः 30 जुलाई, 2016 को, ट्रेडिंग गेट के प्रमुख, उच्च आवृत्ति वाले व्यापारी लीओ ने हांगकांग परिवहन विश्वविद्यालय के हांगकांग पूर्व छात्रों के सम्मेलन के निमंत्रण पर क्वांटिफाइंग फाइनेंस और उच्च आवृत्ति वाले ट्रेडिंग के बारे में एक साझा सम्मेलन आयोजित किया। लीओ की सहमति के साथ, ट्रेडिंग गेट ने विशेष रूप से इस साझाकरण की शुरुआत की।
चित्र 1
चित्र 2
चित्र 3
शहर की रणनीति बनाना
बाजार में तरलता प्रदान करने के लिए बाजार के व्यापारियों की रणनीति का मुख्य उद्देश्य है, बोली / पूछें, बोली / पूछें को संकीर्ण करें, बीच के अंतर को कम करें। यह सरल लगता है, लेकिन कई मॉडल हैं, जोखिम नियंत्रण, आईटी पर हथियारों की दौड़। इस तरह से, यहां के कई मकानों ने बेहतर काम किया है। इसमें बहुत कुछ है जिसके बारे में बात की जा सकती है, जैसे कि अपने स्टॉक को कैसे नियंत्रित करें, अपने जोखिमों को कैसे नियंत्रित करें; बहुत सारे भविष्यवाणियां कैसे करें; अस्थिरता और मूल्य को कैसे भविष्यवाणी करें; यहां आईटी का सवाल बहुत महत्वपूर्ण है, क्योंकि प्रतिस्पर्धा बहुत तेज है; कैसे तेजी से बोली दें, कैसे तेजी से निकालें, सभी बहुत महत्वपूर्ण सवाल हैं। आईटी की लागत बहुत अधिक है, क्योंकि हर कोई प्रतिस्पर्धा कर रहा है, हर कोई तेजी से चाहता है, सह-स्थान से लेकर एफपीजीए तक, अब माइक्रोवेव तक। प्रतिस्पर्धा भयंकर है। यह है क्योंकि सीमा बहुत अधिक है, इसलिए बाकी के कुछ बहुत अच्छा कर रहे हैं। आम निवेशकों के लिए, बाजार की उपस्थिति, जो उन्हें खरीदने और बेचने के लिए कम अंतर देता है, फायदेमंद है। चित्र 4यह पिछले साल 12 अगस्त को एक रणनीति है जो मैंने शेयर बाजार में शेयरों के 50 सूचकांक के वायदा में दिखाया था। उस दिन पूरे बाजार में 225,000 से अधिक ट्रेड हुए, मेरी रणनीति 4.1% (9,180 हाथ) थी, P&L भी अच्छा था, और ड्रॉडाउन भी कम था। पूंजी की मांग भी कम थी, पूरे दिन केवल 500,000 की आवश्यकता थी, 210,000 से अधिक कमाए, 43.5% की लाभप्रदता। पिछले साल जुलाई में, शेयरों की तबाही के कारण, चीन ने शेयरों के वायदा पर कुछ निवेशकों पर प्रतिबंध लगाना शुरू कर दिया था। जुलाई में, कुछ दिनों के लिए बिड / एस्क स्प्रेड के संकेत दिखाई दिए, 7 सितंबर तक, चीन ने सट्टेबाजों पर प्रतिबंध लगाना शुरू कर दिया, जमा राशि को 40% तक बढ़ा दिया, प्लेसमेंट शुल्क को 23 हजार तक बढ़ा दिया गया, एकल किस्मों के लिए एक दिन में 10 से अधिक ट्रेडों की मात्रा नहीं थी। बाजार का कारोबार पहले के 1% तक कम हो गया। क्योंकि बाजार की रणनीति खराब थी, 10 हाथों की रणनीति पूरी तरह से काम नहीं कर रही थी, कुछ बंद हो गए थे। आप बिड / एस्क स्प्रेड के मौन परिवर्तन को देख सकते हैं। चित्र 5चित्र 6इसलिए, बाजार की रणनीति बाजार की तरलता में वृद्धि कर सकती है, बिड / एस्क स्प्रेड को संकीर्ण कर सकती है, और जब बड़ी मात्रा में खरीदारी की जाती है तो बहुत सारे स्लिप पॉइंट नहीं होते हैं। बाजार की रणनीति बनाने के लिए शायद यह अनुमान लगाना आवश्यक है कि कौन सा मूल्य अधिक उचित है।
सांख्यिकीय लाभ यहाँ पर हर एक एक बड़ा विषय है. मैं सिर्फ चर्चा कर रहा हूँ. सांख्यिकीय सूट में संभावनाएं, डेटा खनन, मॉडलिंग, लेनदेन निष्पादन, डेटा क्लीनिंग शामिल हैं। डेटा खनन बहुत महत्वपूर्ण है, और यह कभी-कभी बहुत सिरदर्द हो सकता है। एक क्लासिक कहावत है: Garbage in, Garbage out। बहुत सारे Quants डेटा को संसाधित करने में बहुत समय बिताते हैं। कभी-कभी बहुत ही रोमांचक परिणाम मिलते हैं, और वापस आते हैं कि डेटा गलत है। सबसे सरल लाभ मॉडल में से एक है ऐतिहासिक मूल्य में उतार-चढ़ाव की दरें, दोनों तरफ कुछ निष्पादन क्षेत्रों के साथ। उदाहरण के लिए, दूध का पाउडर, 100 डॉलर के लिए हांगकांग से खरीदा, 120 डॉलर के लिए मुख्य भूमि में बेचा। बीच में आप 10 डॉलर का किराया खर्च करते हैं, और 10 डॉलर कमाते हैं। यह आपका लाभ क्षेत्र है। उदाहरण के लिए, सोने के लिए, घरेलू और विदेशी बाजारों में मानक अनुबंध हैं, सैद्धांतिक रूप से मूल्य समान है, दोनों सोने के टुकड़े निकाले जाते हैं। लेकिन कीमत में उतार-चढ़ाव होगा, हम इस अंतर को गणना करेंगे, यदि यह ऐतिहासिक सांख्यिकीय क्षेत्रों से अलग हो जाता है, जैसे कि ब्रेक्सिट के समय, तो हम पाएंगे कि चीन का सोना सस्ता है, अमेरिकी सोना महंगा है। तो हम कम कीमत पर खरीद सकते हैं, उच्च कीमत पर बेच सकते हैं। बेशक, व्यावहारिक संचालन में, तरलता जैसे कारकों का प्रभाव होगा, इसके लिए कुछ अनुभव की आवश्यकता है।
पूर्वानुमान पिछले बाजार के आंकड़ों और वर्तमान बाजार के माहौल की तुलना करके भविष्य के मूल्य आंदोलनों का पूर्वानुमान करनाः Price=a+b+c. यह भविष्य की कुंजी अगले सेकंड, अगले मिनट, अगले ट्रेडिंग दिन, अगले सप्ताह, अगले महीने हो सकती है. यदि आपका मॉडल सटीक है तो यह भविष्यवाणी करने के लिए NB से बेहतर है, चाहे वह अगले सेकंड, अगले मिनट या अगले सप्ताह हो। जब तक आपका मॉडल प्रभावी है, तब तक यह NB है। यह एक आसान काम नहीं है, आधार, अनुभव की आवश्यकता है। मैं अभी भी सीख रहा हूं, बहुत अनुभव नहीं है। चित्र 7यह मूलभूत प्रक्रिया है डेटा को ठीक करने के लिए, और फिर यह पता लगाने के लिए कि बाजार को प्रभावित करने वाले कारक क्या हैं। आप जल्दी से शुरू कर सकते हैं, एक समोच्च रेखा के साथ शुरू कर सकते हैं, और आप जल्दी से परिणाम प्राप्त कर सकते हैं, लेकिन आपके मॉडल की स्थिरता के लिए कितना स्थिर है, यह ट्यूनिंग और चक्र की आवश्यकता है। आप प्रशिक्षण पर जाते हैं, मॉडल का मूल्यांकन करते हैं, और फिर अपने कारक को अनुकूलित करते हैं। बेशक, अब बहुत सारे कारक हैं, और कुछ लोगों का तरीका है, 500 कारकों में फेंक देना। उनका मॉडल उन्हें बता सकता है कि कौन से कारक काम करते हैं और कौन से कारकों का उपयोग नहीं करते हैं, और उच्च सहसंबंध वाले कारकों को खुद को हटा सकते हैं। लेकिन यह बात, मैं अभी भी सीख रहा हूं, मेरे पास बहुत अनुभव नहीं है। मैं सिर्फ जानता हूं कि ये तरीके हैं। सुपर सिंपल का रहस्य यह नहीं है कि यह सरल है, लेकिन सबसे सरल भविष्यवाणी मॉडल यह है कि कीमत औसत रेखा पर वापस आ जाएगी। औसत रेखा क्या है, इसे स्वयं पीस लें। इस बीच की जटिलता का अधिकांश हिस्सा डेटा से आता है। मॉडल के शब्दों में, आर में बहुत सारे पैकेज हैं, जो आपको बहुत अच्छा स्वचालन करने में मदद कर सकते हैं। कई संकेतक स्वचालित हो सकते हैं, चार्ट भी मददगार हैं। Data और Factor दोनों को लगातार पीसने की जरूरत होती है।
इन दोनों मामलों में, आईटी महत्वपूर्ण है और आपको बहुत सारा पैसा खो सकता है। चित्र 8आईटी सिस्टम को मुख्य रूप से चार भागों में विभाजित किया गया है। मूल्य डेटा अपेक्षाकृत सरल है, और अधिक जटिल है, जैसे कि मौलिक डेटा, असंगठित डेटा, जिसमें बहुत सारे प्रोग्रामर कोड की आवश्यकता होती है, कैसे एकत्रित किया जाए, स्वरूपित किया जाए, एकीकृत किया जाए, एक्सेस किया जाए। एक क्वांट के रूप में, मैं एक दिन के डेटा को चित्रित करना चाहता हूं। हम मूल रूप से इस स्थिति में हैं, जहां डेटा के ढेर से बहुत कुछ करना आसान है, और दूसरे छोर पर क्वांट बहुत कम कोड लिखता है। क्योंकि हम बहुत सारे डेटा संरचनाओं, डेटा इंटरफेस को एकीकृत करते हैं। चाहे C ++, C # या स्काला से, डेटा को उसी प्रारूप में लेना बहुत आसान है। बेशक, आप गलत नहीं हो सकते, आपकी त्रुटि सहनशीलता और आपकी त्रुटि की जांच करने की क्षमता भी बहुत अधिक है। हमने पहले भी ऐसी स्थिति देखी है, पुनरीक्षण बहुत अच्छा है, हम हर दिन पैसा कमाते हैं, और परिणाम गलत हैं। बहुत मूर्खतापूर्ण गलतियाँ। अक्सर होती हैं, मुझे विश्वास है कि बाद में भी होगी। लेकिन बाद में जब हम अच्छे पुनरीक्षण परिणाम देखते हैं, तो हम और अधिक संदेह करते हैं। यह निष्पादन विभिन्न एपीआई, विभिन्न बाजार पहुंच, विभिन्न विंडो हैं। उच्च आवृत्ति क्षेत्र में, गति बहुत महत्वपूर्ण है। क्योंकि बहुत सारे डेटा सार्वजनिक हैं, बहुत से लोग इसे देख सकते हैं। जब बहुत से लोग एक अवसर देखते हैं, तो केवल सबसे तेज़ व्यक्ति ही इसे प्राप्त कर सकते हैं। प्रत्येक बाजार में अलग-अलग एपीआई हैं, एक समान प्रोटोकॉल है, जैसे कि फिक्स प्रोटोकॉल, लेकिन हर एक्सचेंज द्वारा समर्थित नहीं होना चाहिए, लेकिन फिक्स प्रोटोकॉल खुद धीमा है। उच्च आवृत्ति आमतौर पर सी ++ और एफपीजीए के तहत मॉड्यूल हैं, हम आमतौर पर सी ++ और एफपीजीए हैं। अब हमारे पास एक छोटी सी रणनीति है जो एफपीजीए के ऊपर नहीं है। बैक टेस्टिंग, कभी-कभी क्वांट के दिमाग में आने वाली चीजें, शायद आपके बैक टेस्टिंग सिस्टम द्वारा समर्थित नहीं हैं, आपको बैक टेस्टिंग के ढांचे को बदलने की आवश्यकता है। विज़ुअलाइज़ेशन बहुत ज़रूरी है. आप नहीं कह सकते, मुझे संख्याओं का एक ढेर दें, मैं नहीं देख सकता. ग्राफ़ को देखना अधिक स्पष्ट है. हमने स्काला में ग्राफ़ बनाने में बहुत प्रयास किया है, आर में ग्राफ़. क्योंकि ग्राफ़ और डेटा का एक ढेर अलग है। पुनः परीक्षण की गति भी महत्वपूर्ण है. उदाहरण के लिए, एक रणनीति को पुनः परीक्षण करने के लिए, एक वर्ष के डेटा के लिए, आपको एक सप्ताह की आवश्यकता होती है. एक सप्ताह इंतजार करने वाले लोग आपके परिणामों को देख सकते हैं! एक मिनट शायद थोड़ा अधिक स्वीकार कर सकते हैं. रणनीति के भीतर पैरामीटर एक पुनरावृत्ति प्रक्रिया है, जैसे कि पैरामीटर, मैं 1 से 100 तक कोशिश करना चाहता हूं और देखना चाहता हूं कि यह कैसा दिखता है. आप प्रत्येक परीक्षण में 5 मिनट का उपयोग करते हैं, अनुकूलन के समय मुझे 100,000 पैरामीटर की आवश्यकता हो सकती है, इसलिए मैं इंतजार नहीं कर सकता। यहाँ हमने बहुत सारे अनुकूलन भी किए हैं जैसे कि डेटा कैसे लिया जाए, कैसे कैश किया जाए, और बीच में इसका प्रदर्शन कैसे बढ़ाया जाए. पहले, मैंने पिछले कंपनी में कुछ क्लाउड कंप्यूटिंग का प्रयास किया था, और कुछ रीटेस्ट किए गए इंजन को कई सर्वरों पर वितरित किया था. इस तरह, एक अनुरोध बीत गया, कई मशीनें एक साथ चल रही थीं. आप इसे एक दूसरे को प्रभावित किए बिना कर सकते थे. प्रत्येक पैरामीटर स्वतंत्र था. इसे समानांतर में गणना की जा सकती थी. एक और बात है निगरानी. इसमें बहुत अधिक स्वचालन है. इसमें बहुत सारी रणनीतियाँ हैं. इसमें बहुत कम वास्तविकता है। जोखिम की निगरानी कैसे करें, अलर्ट कैसे करें, यह भी एक महत्वपूर्ण कड़ी है. हमारी वर्तमान रणनीतियों की तरह, यह स्वचालित रूप से चल रहा है, सभी रणनीतियों की निगरानी, प्रत्येक रणनीति का जोखिम स्तर अलार्म से अधिक नहीं हो सकता है. विशेष रूप से हम रात के समय भी व्यापार करते हैं, प्रोग्रामरों को अक्सर रात में सोने के लिए, यह बहुत यथार्थवादी नहीं है. इसलिए यदि कोई महत्वपूर्ण त्रुटि है, तो सीधे फोन पर कॉल करें। अब हम बहुत आसान हैं। जब आप बहुत सारी किस्मों का व्यापार करते हैं, तो यह अनिवार्य रूप से संभव नहीं है कि सभी लोग वहां खड़े हों, इसलिए बहुत अधिक निगरानी की जानी चाहिए।
Flash Boys
Quantitative Trading: How to Build Your Own Algorithmic Trading Business
The Quants: How a New Breed of Math Whizzes Conquered Wall Street and Nearly Destroyed It
The Problem of HFT - Collected Writings on High Frequency Trading & Stock Market Structure Reform
Inside the Black Box: A Simple Guide to Quantitative and High Frequency Trading
Algorithmic Trading: Winning Strategies and Their Rationale
Quantitative Trading with R: Understanding Mathematical and Computational Tools from a Quant's Perspective
http://numericalmethod.com/courses/introduction-to-algorithmic-tradingstrategies-2011-2013/ https://www.quantstart.com/articles/beginners-guide-to-quantitative-trading https://www.zhihu.com/publications/nacl/19550372