In den vergangenen Jahren haben wir verschiedene Instrumente untersucht, mit denen wir nutzbare Muster in den Vermögenspreisen identifizieren können.
Während dies alles großartige moderne Werkzeuge für die Datenanalyse sind, verwendet die überwiegende Mehrheit der Asset-Modellierung in der Branche immer noch statistische Zeitreihenanalyse.
Was ist Zeitreihenanalyse?
Zunächst wird eine Zeitreihe als eine Größe definiert, die in der Zeit über ein Intervall hinweg sequentiell gemessen wird.
In seiner breitesten Form geht es bei der Zeitreihenanalyse darum, abzuleiten, was in der Vergangenheit mit einer Reihe von Datenpunkten geschehen ist, und zu versuchen, vorherzusagen, was in Zukunft damit geschehen wird.
Wir werden jedoch einen quantitativen statistischen Ansatz für Zeitreihen annehmen, indem wir davon ausgehen, dass unsere Zeitreihen Realisationen von Sequenzen zufälliger Variablen sind. Das heißt, wir werden annehmen, dass es einen zugrunde liegenden Erzeugungsprozess für unsere Zeitreihen gibt, der auf einer oder mehreren statistischen Verteilungen basiert, aus denen diese Variablen gezogen werden.
Die Zeitreihenanalyse versucht, die Vergangenheit zu verstehen und die Zukunft vorherzusagen.
Eine solche Folge von zufälligen Variablen wird als diskret-zeit-stochastischer Prozess (DTSP) bezeichnet. Im quantitativen Handel beschäftigen wir uns mit dem Versuch, statistische Modelle in diese DTSPs zu passen, um zugrunde liegende Beziehungen zwischen Reihen abzuleiten oder zukünftige Werte vorherzusagen, um Handelssignale zu generieren.
Zeitreihen im Allgemeinen, auch außerhalb der Finanzwelt, enthalten häufig folgende Merkmale:
- Trends - Ein Trend ist eine konsequente Richtungsbewegung in einer Zeitreihe. Diese Trends werden entweder deterministisch oder stochastisch sein. Der erste ermöglicht es uns, eine zugrunde liegende Begründung für den Trend zu liefern, während der zweite ein zufälliges Merkmal einer Reihe ist, das wir wahrscheinlich nicht erklären werden. Trends erscheinen oft in Finanzreihen, insbesondere in Rohstoffpreisen, und viele Commodity Trading Advisor (CTA) -Fonds verwenden anspruchsvolle Trendidentifikationsmodelle in ihren Handelsalgorithmen.
- Saisonale Schwankungen - Viele Zeitreihen enthalten saisonale Schwankungen. Dies gilt insbesondere für Reihen, die Geschäftsverkäufe oder Klimaspiegel darstellen. In der quantitativen Finanzierung sehen wir oft saisonale Schwankungen in Rohstoffen, insbesondere solche, die mit den Wachstumssaisons oder den jährlichen Temperaturschwankungen (wie Erdgas) zusammenhängen.
- Serienabhängigkeit - Eine der wichtigsten Eigenschaften von Zeitreihen, insbesondere Finanzreihen, ist die der seriellen Korrelation. Dies tritt auf, wenn Zeitreihenbeobachtungen, die zeitlich nahe beieinander liegen, korrelieren.
Wie können wir Zeitreihenanalysen in der quantitativen Finanzierung anwenden?
Unser Ziel als quantitative Forscher ist es, Trends, saisonale Schwankungen und Korrelationen mithilfe statistischer Zeitreihenmethoden zu identifizieren und letztendlich Handelssignale oder Filter basierend auf Schlußfolgerungen oder Vorhersagen zu erzeugen.
Unser Ansatz wird sein:
- Vorhersage und Vorhersage zukünftiger Werte - Um erfolgreich handeln zu können, müssen wir zukünftige Vermögenspreise, zumindest in statistischem Sinne, genau vorhersagen.
- Simulationsreihen - Sobald wir statistische Eigenschaften von Finanzzeitreihen identifiziert haben, können wir sie verwenden, um Simulationen zukünftiger Szenarien zu erzeugen. Dies ermöglicht es uns, die Anzahl der Trades, die erwarteten Handelskosten, das erwartete Renditeprofil, die technischen und finanziellen Investitionen in Infrastruktur und damit letztendlich das Risikoprofil und die Rentabilität einer bestimmten Strategie oder eines Portfolios zu schätzen.
- Infer Relationships - Die Identifizierung von Beziehungen zwischen Zeitreihen und anderen quantitativen Werten ermöglicht es uns, unsere Handelssignale durch Filtermechanismen zu verbessern. Wenn wir beispielsweise ableiten können, wie sich der Spread in einem Devisenpaar mit dem Bid/Ask-Volumen ändert, können wir alle potenziellen Trades filtern, die in einem Zeitraum auftreten können, in dem wir einen breiten Spread prognostizieren, um die Transaktionskosten zu reduzieren.
Darüber hinaus können wir auf unsere Zeitreihenmodelle Standard- (klassische/frequentistische oder bayesische) statistische Tests anwenden, um bestimmte Verhaltensweisen zu rechtfertigen, z. B. Regimewechsel an den Aktienmärkten.
Zeitreihenanalysesoftware
Bisher haben wir fast ausschließlich C++ und Python für unsere Handelsstrategie-Implementierung verwendet. Beide Sprachen sind First-Class-Umgebungen zum Schreiben eines gesamten Handelsstacks. Beide enthalten viele Bibliotheken und erlauben eine End-to-End Konstruktion eines Handelssystems ausschließlich innerhalb dieser Sprache.
Leider verfügen C++ und Python nicht über umfangreiche statistische Bibliotheken. Dies ist einer ihrer Mängel. Aus diesem Grund werden wir die statistische Umgebung von R als Mittel zur Durchführung von Zeitreihenforschung verwenden. R ist aufgrund der Verfügbarkeit von Zeitreihenbibliotheken, statistischen Methoden und einfachen Plotungsmöglichkeiten gut geeignet.
Wir werden R in einer Problemlösungsweise lernen, wobei neue Befehle und Syntax nach Bedarf eingeführt werden.
QuantStart Zeitreihenanalyse Fahrplan
Die bisherigen Artikel zu den Themen statistisches Lernen, Ökonometrie und bayesische Analyse waren meist einführender Natur und haben keine Anwendung solcher Techniken auf moderne, hochfrequente Preisinformationen betrachtet.
Um einige der oben genannten Techniken auf Hochfrequenzdaten anzuwenden, benötigen wir einen mathematischen Rahmen, in dem wir unsere Forschung vereinheitlichen können.
Schließlich werden wir bayesische Werkzeuge und maschinelle Lerntechniken in Verbindung mit den folgenden Methoden verwenden, um Preisniveau und -richtung vorherzusagen, als Filter zu fungieren und "Regime Change" zu bestimmen, d. h. zu bestimmen, wann unsere Zeitreihen ihr zugrunde liegendes statistisches Verhalten geändert haben.
Die Methoden für die Erfassung von Hochfrequenzdaten werden in den folgenden Kapiteln erörtert.
- Einführung in Zeitreihen - Dieser Artikel beschreibt den Bereich der Zeitreihenanalyse, seinen Umfang und wie er auf Finanzdaten angewendet werden kann.
- Korrelation - Ein absolut grundlegender Aspekt der Modellierung von Zeitreihen ist das Konzept der seriellen Korrelation. Wir werden es definieren und eine der größten Fallstricke der Zeitreihenanalyse beschreiben, nämlich dass Korrelation keine Kausalität impliziert.
- Prognose - In diesem Abschnitt werden wir das Konzept der Prognose betrachten, d. h. Vorhersagen über die zukünftige Richtung oder das zukünftige Niveau für eine bestimmte Zeitreihe machen, und wie es in der Praxis durchgeführt wird.
- Stochastische Modelle - Wir haben einige Zeit damit verbracht, stochastische Modelle auf dem Gebiet der Optionspreise auf der Website zu betrachten, nämlich mit geometrischer Brownian Motion und stochastischer Volatilität.
- Regression - Wenn wir deterministische (im Gegensatz zu stochastischen) Trends in den Daten haben, können wir ihre Extrapolation mithilfe von Regressionsmodellen rechtfertigen.
- Stationäre Modelle - Stationäre Modelle gehen davon aus, dass die statistischen Eigenschaften (d. h. Mittelwert und Varianz) der Reihen zeitlich konstant sind.
- Nicht stationäre Modelle - Viele Finanzzeitreihen sind nicht stationär, d.h. sie haben unterschiedliche Mittelwerte und Varianzen. Insbesondere haben Vermögenspreise oft Perioden hoher Volatilität. Für diese Reihen müssen wir nicht stationäre Modelle wie ARIMA, ARCH und GARCH verwenden.
- Multivariate Modellierung - Wir haben in der Vergangenheit Multivariate Modelle auf QuantStart betrachtet, nämlich als wir durchschnittlich umkehrende Aktienpaare betrachteten. In diesem Abschnitt werden wir die Kointegration strenger definieren und weitere Tests dafür untersuchen. Wir werden auch vektorautoregressive (VAR) Modelle betrachten [nicht mit Value-at-Risk! verwechseln].
- State-Space Models - State Space Modeling entlehnt sich eine lange Geschichte der modernen Steuerungstheorie, die im Ingenieurwesen verwendet wird, um uns Zeitreihen mit schnell wechselnden Parametern (wie die β-Neigung zwischen zwei kointegrierten Vermögenswerten in einer linearen Regression) zu modellieren.