High-Frequency-Handel-Strategien für das Orderbuch basierend auf maschinellem Lernen

Schriftsteller:Die Erfinder quantifizieren - Kleine Träume, Erstellt: 2016-11-16 16:52:38, Aktualisiert: 2016-11-16 16:55:18

High-Frequency-Handel-Strategien für das Orderbuch basierend auf maschinellem Lernen

  • ### Ein, Zitat Die Handelsmechanismen der Wertpapiermärkte können in zwei Kategorien unterteilt werden: Bietungs- und Auftragsmarkt, der auf Liquidität durch Marktteilnehmer angewiesen ist, der Liquidität durch Preisbeschränkungen bietet, und der Handel wird durch Auftrags- und Auftrags-Angebote von Investoren gebildet.

基于机器学习的订单簿高频交易策略Diagramm 1 Marktdiagramm für Bestellungen

  • (i) Beschreibung des Bestellbuchs für die limitierten Preise

    Die Studie des Auftragsbuchs gehört zur Kategorie der Marktmikrostrukturforschung. Die Marktmikrostrukturtheorie stützt sich auf die Preistheorie und die Verkäufertheorie in der Mikroökonomie als Ideenquelle. In ihrer Analyse ihrer Kernfragen über den Handel mit finanziellen Vermögenswerten und die Prozesse und Ursachen ihrer Preisbildung werden verschiedene Theorien und Methoden verwendet, darunter allgemeine Gleichgewichte, lokale Gleichgewichte, marginale Erträge, marginale Kosten, Marktkontinuität, Lagerstückstheorie, Spieltheorie, Informationsökonomie.

    Aus der Progression der Forschung im Ausland ist der Bereich der Marktmikrostrukturen mit O Hara vertreten. Die meisten Theorien basieren auf Markt- und Handelsmärkten (d.h. bieten- und informationsgetriebenen Märkten), wie Lagermodellen und Informationsmodellen usw. In den letzten Jahren hat die Auftrags- und Handelsmärkte ihre Stellung zunehmend erlangt, aber es gibt relativ wenig Forschung speziell für die Auftrags- und Handelsmärkte.

    Der heimische Wertpapiermarkt und der Futuresmarkt gehören beide zu den bestellungsgetriebenen Märkten. Die folgende Abbildung ist ein Screenshot des Level_1 Marktordnungsbuchs von IF1312 für Aktienindex-Futures. Es gibt nicht viel Informationen, die direkt von oben gewonnen werden, und die grundlegenden Informationen umfassen einen Kaufpreis, einen Verkaufspreis, eine Menge zu kaufen und eine Menge zu verkaufen. In einigen akademischen Artikeln im Ausland gibt es auch ein Informationsbuch, das dem Auftragsbuch entspricht, einschließlich der detailliertesten Auftragsdatensammlung, einschließlich der Anzahl der Aufträge, der gelieferten Preise, der Art der Aufträge und so weiter.

    基于机器学习的订单簿高频交易策略Abbildung 2 Aktienindex Futures-Hauptkontrakte Level-1-Auftragsbuch

  • (ii) Fortschritte bei der Erforschung von Hochfrequenz-Transaktionen im Auftragsbuch

    Die dynamische Modellierung des Auftragsbuchs besteht hauptsächlich aus zwei Methoden, der klassischen Methode der Messökonomie und der Methode des maschinellen Lernens. Die Methode der Messökonomie ist eine der klassischen Mainstream-Forschungsmethoden, wie z. B. die MRR-Belegung für die Preisdifferenzanalyse, die Huang- und Stoll-Belegung, das ACD-Modell für die Bestelldauer und das Logistic-Modell für die Preisprognose.

    Auch in der Finanzwelt ist wissenschaftliche Forschung sehr aktiv, wie zum Beispiel die 2012 veröffentlichte Studie Forecasting trends of high_frequency KOSPI200 index data using learning classifiers ist eine gängige Forschungsidee, bei der allgemeine Indikatoren der technischen Analyse (MA, EMA, RSI usw.) eingesetzt werden, um Marktprognosen zu machen.

  • Zweitens: Anwendung von Machine Learning bei hohen Frequenzgeschäften im Auftragsbuch

    • #### (1) Systemarchitektur Das folgende Diagramm ist eine Systemarchitektur für typische maschinelle Lernhandelsstrategien, die Bestellbuchdaten, Merkmalfindung, Modellkonstruktion und -verifizierung und einige Hauptmodule für Handelschancen umfasst. Es ist bemerkenswert, dass der Handelsprozess durch Marktereignisse ausgelöst wird, von denen die Ankunft eines Ticksmarktes eines ist.

    基于机器学习的订单簿高频交易策略Abbildung 3 Systemarchitektur für die Modellierung von Bestellbüchern mit Hilfe von maschinellem Lernen

    • #### (B) Unterstützung von Vektormaschinen In den 1970er Jahren begannen Wapnik und andere, ein vergleichsweise vollständiges theoretisches System des statistischen Lernens (SLT, Statistical Learning Theory) zu entwickeln, das für die Untersuchung von statistischen Regeln und der Eigenschaften von Lernmethoden in begrenzten Probenahmen verwendet wurde. Es erstellte einen guten theoretischen Rahmen für die Lösung von Problemen des begrenzten Lernens und löste praktische Probleme wie kleine Proben, Nichtlinearität, hochdimensionale Zahlen und lokale Extreme besser.

    SVM entwickelt sich aus der optimalen Sortationsüberfläche bei linear teilbarem Zustand. Für die beiden Klassifizierungsprobleme wird der Trainingsmustersatz festgelegt als ((xi,yi), i=1,2...l, l ist die Anzahl der Trainingsproben, xi ist das Trainingsmuster, yi gehört zu den Klassenzeichen für die Eingabe von Stichprobenxi ((erwartete Ausgabe)).

    Die optimale Klassifikationsüberfläche ist nicht nur in der Lage, alle Proben richtig zu trennen (die Trainingsfehlerquote ist 0), sondern auch die Margin zwischen den beiden Klassen zu maximieren, definiert als die Summe der kleinsten Entfernung zwischen dem Trainingsdatensatz und der Klassifikationsüberfläche. Die optimale Klassifikationsüberfläche bedeutet den geringsten durchschnittlichen Klassifikationsfehler für die Testdaten.

    Wenn es eine Überfläche in einem d-dimensionalen Vektorraum gibt:

    F(x) = w*x+b=0

    Wenn man die beiden Datenkategorien trennen kann, nennt man diese Suprauflage eine Teiloberfläche. Hier w*x ist das Innenvolumen der beiden Vektoren w und x in einem d-dimensionalen Vektorraum.

    Wenn die Benutzeroberfläche:

    w*x+b=0

    Die Grenze zwischen den beiden nächstgelegenen Probengattungen der Teiloberfläche ist die maximale.

    基于机器学习的订单簿高频交易策略Diagramm 4 Anzeige der Interface für SVM-Doppelkategorien

    Einheitlichung der Optimum-Interface-Equation, um die Entfernung zwischen den beiden Probengattungen zu ermöglichen

    基于机器学习的订单簿高频交易策略

    Also für jede beliebige Probe gibt es

    基于机器学习的订单簿高频交易策略

    Um die optimale Schnittstelle zu erhalten, muss man die oben genannten Formeln nicht nur erfüllen, sondern auch minimieren.

    Das mathematische Modell für das SVM-Problem lautet:基于机器学习的订单簿高频交易策略

    SVM entwickelte sich schließlich zu einem optimalen Planungsproblem, dessen Forschungsschwerpunkte in der Wissenschaft vor allem die schnelle Lösung, die Verbreitung in mehrere Kategorien, die Anwendung von praktischen Problemen usw. waren.

    SVM wurde ursprünglich für Zweiklassprobleme entwickelt und wurde in der Praxis auf Multiklassprobleme ausgedehnt. Die bestehenden Multiklassalgorithmen umfassen ein-zu-mehr-, ein-zu-eins-, Fehlerkorrektur-Codierung, DAG-SVM und Multi-i-Class-SVM-Klassifikatoren.

    • #### (III) Auftragsbuch-Indikatoren extrahieren Als Beispiel für den Aktienindex-Futures-Level-1-Markt enthält das Auftragsbuch hauptsächlich Basisindikatoren wie Kauf-, Verkaufspreis-, Kauf- und Verkaufsmengen, und kann Indikatoren wie Tiefe, Steigung, Relative Differenz ableiten. Andere Indikatoren umfassen Haltegehalt, Volumen, Gewichtung usw., insgesamt 17 Indikatoren, wie in der folgenden Tabelle gezeigt.

    Tabelle 1 Indikatorenbank basierend auf dem Level-Buchsbestellbuch

    基于机器学习的订单簿高频交易策略

    • #### (IV) Dynamische Merkmale des Auftragsbuchs und Transaktionsmöglichkeiten In der Marktmikroskopie gibt es zwei Methoden zur Messung von Preisbewegungen in kurzer Zeit, eine ist die mittlere Preisbewegung und die andere ist die Preisdifferenzkreuzung.

    基于机器学习的订单簿高频交易策略

    Die Größe der Veränderung des mittleren Preises ΔP im Auftragsbuch in Δt wird in drei Kategorien unterteilt.

    Das folgende Diagramm zeigt die Verteilung der mittleren Preisbewegung für das Hauptvertrag IF1311 am 29. Oktober mit 32400 Ticks pro Tag.

    Bei Δt=1 tick ist der absolute Wert der Zwischenpreisänderung von 0.2 etwa 6000 Mal, der absolute Wert der Veränderung von 0.4 etwa 1500 Mal, der absolute Wert der Veränderung von 0.6 etwa 150 Mal, der absolute Wert der Veränderung von 0.8 größer als 50 Mal und der absolute Wert der Veränderung größer als 1 etwa 10 Mal gleich.

    Bei Δt=2 tick ist der absolute Wert der Zwischenpreisänderung von 0.2 etwa 7000 Mal, der absolute Wert der Veränderung von 0.4 etwa 3000 Mal, der absolute Wert der Veränderung von 0.6 etwa 550 Mal, der absolute Wert der Veränderung von 0.8 etwa 205 Mal und der absolute Wert der Veränderung größer als 1 etwa 10 Mal gleich.

    Wir denken, dass die Absolute der Veränderung größer als 0,4 ist, wenn sie eine potenzielle Handelschance ist. Bei Δt = 1 tick gibt es etwa 1700 Gelegenheiten pro Tag; bei Δt = 2 tick gibt es etwa 4000 Gelegenheiten pro Tag.

    基于机器学习的订单簿高频交易策略

    Schaubild 5 IF1311 Verteilung der Veränderung des mittleren Preises am 29. Oktober ((Δt=1 tick)

    基于机器学习的订单簿高频交易策略

    Schaubild 6 IF1311 Verteilung der Veränderung des mittleren Preises am 29. Oktober ((Δt=2 tick)

  • 3. Strategische Beweise

    Da die SVM-Modelle bei großen Stichproben mit einer relativ hohen Trainingskomplexität und längeren Trainingszeiten ausgestattet sind, haben wir die historischen Marktdaten für relativ kurze Zeiträume ausgewählt, um die Wirksamkeit des Modells mit den Level_1-Marktdaten des IF1311-Vertrages im Oktober zu überprüfen.

    • #### (1) Modellwirkungstests Datenzyklus: Marktdaten für IF1311-Kontrakte im Oktober;

    Δt-Wertung: Je kleiner Δt ist, desto höher sind die Anforderungen an die Transaktionsdetails, und es ist schwierig, in den tatsächlichen Transaktionen einen Gewinn zu erzielen, wenn Δt = 1 tick.

    Modellbewertungsindikatoren: Sammelgenauigkeit, Prüfgenauigkeit, Prognosezeit.基于机器学习的订单簿高频交易策略Tabelle 2 Prognose der Wirkung von 1 tick mit 1 tick Daten

    基于机器学习的订单簿高频交易策略Tabelle 3 Prognose der Effekte von Tick 2 mit 1 Tick-Daten

    基于机器学习的订单簿高频交易策略Tabelle 4 Wirkung von 2 ticks mit 2 tick Daten

    Aus den Daten der drei Tabellen können wir folgende Schlussfolgerungen ziehen: Die höchste Genauigkeit beträgt etwa 70%, bei einer Genauigkeit von 60% kann sie in eine Handelsstrategie umgewandelt werden.

    • #### (B) Strategien, die die Gewinne simulieren Zum Beispiel am 31. Oktober haben wir einen simulierten Handel durchgeführt, bei dem die Aktien-Futures von Institutionen in der Regel mit einer Aktien-Futures von Institutionen verhandelt werden, bei denen die Aktien-Futures von Institutionen in der Regel mit 0 verhandelt werden.2610000Wir gehen davon aus, dass die Anzahl der Trades nicht begrenzt ist, dass der Einseitigkeitspreis für jeden Handel 0,2 Punkte beträgt und dass die Anzahl der Einzelhändler pro Hand 1 beträgt.

    Tabelle 5 Simulation der Handelsstrategie am 31. Oktober基于机器学习的订单簿高频交易策略

    Die Anzahl der täglichen Trades beträgt 605, einschließlich der Prozedur, die Gewinnrate beträgt 339, die Gewinnrate beträgt 56%, der Nettogewinn beträgt 11814.99 Yuan.

    Der theoretische Gleitpreis beträgt 14520 Yuan. Dieser Teil ist der Schlüssel zum strategischen Praxiskampf. Wenn die Details der Aufträge genauer kontrolliert werden, kann der Gleitpreis reduziert und der Netto-Nutzen erhöht werden.

    Schaubild 7: Analogstrategie erzielt am 31. Oktober基于机器学习的订单簿高频交易策略

Der Autor des Artikels ist der Autor des Artikels, Übertragung bitte unter Angabe der Quelle.


Weitere Informationen

- Ich weiß nicht.Goodwin lernt, wie man einen Auftrag leistet