Die Ressourcen sind geladen. Beförderung...

High-Frequency-Handel-Strategien für das Orderbuch basierend auf maschinellem Lernen

Schriftsteller:Die Erfinder quantifizieren - Kleine Träume, Erstellt: 2016-11-16 16:52:38, Aktualisiert: 2016-11-16 16:55:18

High-Frequency-Handel-Strategien für das Orderbuch basierend auf maschinellem Lernen

  • Das ist nicht wahr.

    Die Handelsmechanismen der Wertpapiermärkte können in zwei Kategorien unterteilt werden: Bietungs- und Auftragsmarkt, der auf Liquidität durch Marktteilnehmer angewiesen ist, der Liquidität durch Limit-Preis-Anweisungen bietet, und der Handel wird durch Auftrags- und Auftrags-Ausschreibungen von Investoren gebildet. Der chinesische Wertpapiermarkt ist ein Auftragsmarkt, der den Aktienmarkt und den Futuresmarkt umfasst.

    imgDiagramm 1 Marktdiagramm für Bestellungen

    • (i) Beschreibung des Bestellbuchs für die limitierten Preise

      Die Studie des Auftragsbuchs gehört zur Kategorie der Marktmikrostrukturforschung. Die Marktmikrostrukturtheorie stützt sich auf die Preistheorie und die Verkäufertheorie in der Mikroökonomie als Ideenquelle. In ihrer Analyse ihrer Kernfragen über den Handel mit finanziellen Vermögenswerten und die Prozesse und Ursachen ihrer Preisbildung werden verschiedene Theorien und Methoden verwendet, darunter allgemeine Gleichgewichte, lokale Gleichgewichte, marginale Erträge, marginale Kosten, Marktkontinuität, Lagerstückstheorie, Spieltheorie, Informationsökonomie.

      Aus der Progression der Forschung im Ausland ist der Bereich der Marktmikrostrukturen mit O Hara vertreten. Die meisten Theorien basieren auf Markt- und Handelsmärkten (d.h. bieten- und informationsgetriebenen Märkten), wie Lagermodellen und Informationsmodellen usw. In den letzten Jahren hat die Auftrags- und Handelsmärkte ihre Stellung zunehmend erlangt, aber es gibt relativ wenig Forschung speziell für die Auftrags- und Handelsmärkte.

      Der heimische Wertpapiermarkt und der Futuresmarkt gehören beide zu den bestellungsgetriebenen Märkten. Die folgende Abbildung ist ein Screenshot des Level_1 Marktordnungsbuchs von IF1312 für Aktienindex-Futures. Es gibt nicht viel Informationen, die direkt von oben gewonnen werden, und die grundlegenden Informationen umfassen einen Kaufpreis, einen Verkaufspreis, eine Menge zu kaufen und eine Menge zu verkaufen. In einigen akademischen Artikeln im Ausland gibt es auch ein Informationsbuch, das dem Auftragsbuch entspricht, einschließlich der detailliertesten Auftragsdatensammlung, einschließlich der Anzahl der Aufträge, der gelieferten Preise, der Art der Aufträge und so weiter.

      imgAbbildung 2 Aktienindex Futures-Hauptkontrakte Level-1-Auftragsbuch

    • (ii) Fortschritte bei der Erforschung von Hochfrequenz-Transaktionen im Auftragsbuch

      Die dynamische Modellierung des Auftragsbuchs besteht hauptsächlich aus zwei Methoden, der klassischen Methode der Messökonomie und der Methode des maschinellen Lernens. Die Methode der Messökonomie ist eine der klassischen Mainstream-Forschungsmethoden, wie z. B. die MRR-Belegung für die Preisdifferenzanalyse, die Huang- und Stoll-Belegung, das ACD-Modell für die Bestelldauer und das Logistic-Modell für die Preisprognose.

      Auch in der Finanzwelt ist wissenschaftliche Forschung sehr aktiv, wie zum Beispiel die 2012 veröffentlichte Studie Forecasting trends of high_frequency KOSPI200 index data using learning classifiers ist eine gängige Forschungsidee, bei der allgemeine Indikatoren der technischen Analyse (MA, EMA, RSI usw.) eingesetzt werden, um Marktprognosen zu machen.

  • Zweitens: Anwendung von Machine Learning bei hohen Frequenzgeschäften im Auftragsbuch

    • (a) Systemarchitektur

      Das folgende Diagramm ist eine Systemarchitektur für typische maschinelle Lernhandelsstrategien, die Bestellbuchdaten, Merkmalfindung, Modellkonstruktion und -verifizierung und einige Hauptmodule für Handelschancen umfasst. Es ist bemerkenswert, dass der Handelsprozess durch Marktereignisse ausgelöst wird, von denen die Ankunft eines Ticksmarktes eines ist.

      imgAbbildung 3 Systemarchitektur für die Modellierung von Bestellbüchern mit Hilfe von maschinellem Lernen

    • (2) Unterstützung von Vektormaschinen

      In den 1970er Jahren begannen Wapnik und andere, ein vergleichsweise vollständiges theoretisches System der statistischen Lerntheorie (SLT) zu entwickeln, die zur Untersuchung von statistischen Regeln und der Eigenschaften von Lernmethoden unter begrenzten Probenahmen verwendet wurde. Sie stellte einen guten theoretischen Rahmen für die Lösung von Problemen mit begrenztem Lernvermögen und löste praktische Probleme wie kleine Proben, Nichtlinearität, hochdimensionale Zahlen und lokale Extreme besser.

      SVM entwickelt sich aus der optimalen Sortationsüberfläche bei linear teilbarem Zustand. Für die beiden Klassifizierungsprobleme wird der Trainingsmustersatz festgelegt als ((xi,yi), i=1,2...l, l ist die Anzahl der Trainingsproben, xi ist das Trainingsmuster, yi gehört zu den Klassenzeichen für die Eingabe von Stichprobenxi ((erwartete Ausgabe)).

      Die optimale Klassifikationsüberfläche ist nicht nur in der Lage, alle Proben richtig zu trennen (die Trainingsfehlerquote ist 0), sondern auch die Margin zwischen den beiden Klassen zu maximieren, definiert als die Summe der kleinsten Entfernung zwischen dem Trainingsdatensatz und der Klassifikationsüberfläche. Die optimale Klassifikationsüberfläche bedeutet den geringsten durchschnittlichen Klassifikationsfehler für die Testdaten.

      Wenn es eine Überfläche in einem d-dimensionalen Vektorraum gibt:

      F(x) = w*x+b=0

      Wenn man die beiden Datenkategorien trennen kann, nennt man diese Suprauflage eine Teiloberfläche. Hier w*x ist das Innenvolumen der beiden Vektoren w und x in einem d-dimensionalen Vektorraum.

      Wenn die Benutzeroberfläche:

      w*x+b=0

      Die Grenze zwischen den beiden nächstgelegenen Probengattungen der Teiloberfläche ist die maximale.

      imgDiagramm 4 Anzeige der Interface für SVM-Doppelkategorien

      Einheitlichung der Optimum-Interface-Equation, um die Entfernung zwischen den beiden Probengattungen zu ermöglichen

      img

      Also für jede beliebige Probe gibt es

      img

      Um die optimale Schnittstelle zu erhalten, muss man die oben genannten Formeln nicht nur erfüllen, sondern auch minimieren.

      Das mathematische Modell für das SVM-Problem lautet:img

      SVM entwickelte sich schließlich zu einem optimalen Planungsproblem, dessen Forschungsschwerpunkte in der Wissenschaft vor allem die schnelle Lösung, die Verbreitung in mehrere Kategorien, die Anwendung von praktischen Problemen usw. waren.

      SVM wurde ursprünglich für Zweiklassprobleme entwickelt und wurde in der Praxis auf Multiklassprobleme ausgedehnt. Die bestehenden Multiklassalgorithmen umfassen ein-zu-mehr-, ein-zu-eins-, Fehlerkorrektur-Codierung, DAG-SVM und Multi-i-Class-SVM-Klassifikatoren.

    • (3) Ausbeute der Bestellbuchindikatoren

      Als Beispiel für den Aktienindex-Futures-Level-1-Markt umfasst das Auftragsbuch hauptsächlich Basisindikatoren wie Kauf-, Verkaufs-, Kauf- und Verkaufsvolumen, und kann Indikatoren wie Tiefe, Steigung, Relative Differenz ableiten. Andere Indikatoren umfassen Haltegehalt, Volumen, Gewichtung usw., insgesamt 17 Indikatoren, wie in der folgenden Tabelle gezeigt. Es können auch häufig verwendete Indikatoren der technischen Analyse wie RSI, KDJ, MA, EMA usw. eingeführt werden.

      Tabelle 1 Indikatorenbank basierend auf dem Level-Buchsbestellbuch

      img

    • 4. Dynamische Merkmale des Auftragsbuchs und Transaktionsmöglichkeiten

      In der Marktmikroskopie gibt es zwei Methoden zur Messung von Preisbewegungen in kurzer Zeit, eine ist die mittlere Preisbewegung und die andere ist die Preisdifferenzkreuzung.

      img

      Die Größe der Veränderung des mittleren Preises ΔP im Auftragsbuch in Δt wird in drei Kategorien unterteilt.

      Das folgende Diagramm zeigt die Verteilung der mittleren Preisbewegung für das Hauptvertrag IF1311 am 29. Oktober mit 32400 Ticks pro Tag.

      Bei Δt=1 tick ist der absolute Wert der Zwischenpreisänderung von 0.2 etwa 6000 Mal, der absolute Wert der Veränderung von 0.4 etwa 1500 Mal, der absolute Wert der Veränderung von 0.6 etwa 150 Mal, der absolute Wert der Veränderung von 0.8 größer als 50 Mal und der absolute Wert der Veränderung größer als 1 etwa 10 Mal gleich.

      Bei Δt=2 tick ist der absolute Wert der Zwischenpreisänderung von 0.2 etwa 7000 Mal, der absolute Wert der Veränderung von 0.4 etwa 3000 Mal, der absolute Wert der Veränderung von 0.6 etwa 550 Mal, der absolute Wert der Veränderung von 0.8 etwa 205 Mal und der absolute Wert der Veränderung größer als 1 etwa 10 Mal gleich.

      Wir denken, dass die Absolute der Veränderung größer als 0,4 ist, wenn sie eine potenzielle Handelschance ist. Bei Δt = 1 tick gibt es etwa 1700 Gelegenheiten pro Tag; bei Δt = 2 tick gibt es etwa 4000 Gelegenheiten pro Tag.

      img

      Schaubild 5 IF1311 Verteilung der Veränderung des mittleren Preises am 29. Oktober ((Δt=1 tick)

      img

      Schaubild 6 IF1311 Verteilung der Veränderung des mittleren Preises am 29. Oktober ((Δt=2 tick)

  • 3. Strategische Beweise

    Da die SVM-Modelle bei großen Stichproben mit einer relativ hohen Trainingskomplexität und längeren Trainingszeiten ausgestattet sind, haben wir die historischen Marktdaten für relativ kurze Zeiträume ausgewählt, um die Wirksamkeit des Modells mit den Level_1-Marktdaten des IF1311-Vertrages im Oktober zu überprüfen.

    • (1) Modellwirkungstests

      Datenzyklus: Marktdaten für IF1311-Kontrakte im Oktober;

      Δt-Wertung: Je kleiner Δt ist, desto höher sind die Anforderungen an die Transaktionsdetails, und es ist schwierig, in den tatsächlichen Transaktionen einen Gewinn zu erzielen, wenn Δt = 1 tick.

      Modellbewertungsindikatoren: Sammelgenauigkeit, Prüfgenauigkeit, Prognosezeit.imgTabelle 2 Prognose der Wirkung von 1 tick mit 1 tick Daten

      imgTabelle 3 Prognose der Effekte von Tick 2 mit 1 Tick-Daten

      imgTabelle 4 Wirkung von 2 ticks mit 2 tick Daten

      Aus den Daten der drei Tabellen können wir folgende Schlussfolgerungen ziehen: Die höchste Genauigkeit beträgt etwa 70%, bei einer Genauigkeit von 60% kann sie in eine Handelsstrategie umgewandelt werden.

    • 2. Strategische Simulationen von Erträgen

      Nehmen wir zum Beispiel am 31. Oktober ein simuliertes Geschäft, bei dem die Aktien-Futures von Institutionen in der Regel mit einer Aktien-Futures von 0.26/10000 verhandelt werden. Wir gehen davon aus, dass die Anzahl der Transaktionen unbegrenzt ist.

      Tabelle 5 Simulation der Handelsstrategie am 31. Oktoberimg

      Die Anzahl der täglichen Trades beträgt 605, einschließlich der Prozedur, die Gewinnrate beträgt 339, die Gewinnrate beträgt 56%, der Nettogewinn beträgt 11814.99 Yuan.

      Der theoretische Gleitpreis beträgt 14520 Yuan. Dieser Teil ist der Schlüssel zum strategischen Praxiskampf. Wenn die Details der Aufträge genauer kontrolliert werden, kann der Gleitpreis reduziert und der Netto-Nutzen erhöht werden.

      Schaubild 7: Analogstrategie erzielt am 31. Oktoberimg

Der Autor des Artikels ist der Autor des Artikels, Übertragung bitte unter Angabe der Quelle.


Mehr

- Ich weiß nicht.Goodwin lernt, wie man einen Auftrag leistet