En los últimos años, hemos examinado diversas herramientas para ayudarnos a identificar patrones explotables en los precios de los activos, en particular la economometría básica, el aprendizaje automático estadístico y las estadísticas bayesianas.
Si bien estas son todas grandes herramientas modernas para el análisis de datos, la gran mayoría de los modelos de activos en la industria todavía utiliza el análisis de series de tiempo estadísticas.
¿Qué es el análisis de series temporales?
En primer lugar, una serie de tiempo se define como alguna cantidad que se mide secuencialmente en el tiempo durante algún intervalo.
En su forma más amplia, el análisis de series de tiempo se trata de inferir lo que ha sucedido a una serie de puntos de datos en el pasado y tratar de predecir lo que le sucederá en el futuro.
Sin embargo, vamos a tomar un enfoque estadístico cuantitativo a las series de tiempo, asumiendo que nuestras series de tiempo son realizaciones de secuencias de variables aleatorias. es decir, vamos a asumir que hay algún proceso de generación subyacente para nuestras series de tiempo basado en una o más distribuciones estadísticas de las que se extraen estas variables.
El análisis de series temporales intenta comprender el pasado y predecir el futuro.
Tal secuencia de variables aleatorias se conoce como un proceso estocástico de tiempo discreto (DTSP). En el comercio cuantitativo nos preocupamos por intentar ajustar modelos estadísticos a estos DTSP para inferir relaciones subyacentes entre series o predecir valores futuros con el fin de generar señales comerciales.
Las series temporales en general, incluidas las fuera del mundo financiero, a menudo contienen las siguientes características:
- Tendencias - Una tendencia es un movimiento direccional consistente en una serie de tiempo. Estas tendencias serán deterministas o estocásticas. La primera nos permite proporcionar una justificación subyacente para la tendencia, mientras que la segunda es una característica aleatoria de una serie que es poco probable que explicemos. Las tendencias a menudo aparecen en series financieras, particularmente en los precios de los productos básicos, y muchos fondos de Commodity Trading Advisor (CTA) utilizan modelos de identificación de tendencias sofisticados en sus algoritmos de negociación.
- Variación estacional - Muchas series de tiempo contienen variación estacional. Esto es particularmente cierto en las series que representan las ventas de negocios o los niveles climáticos.
- Una de las características más importantes de las series temporales, en particular las series financieras, es la de la correlación serial. Esto ocurre cuando las observaciones de series temporales que están cerca unas de otras en el tiempo tienden a estar correlacionadas.
¿Cómo podemos aplicar el análisis de series temporales en finanzas cuantitativas?
Nuestro objetivo como investigadores cuantitativos es identificar tendencias, variaciones estacionales y correlación utilizando métodos de series temporales estadísticas, y en última instancia generar señales comerciales o filtros basados en inferencias o predicciones.
Nuestro enfoque será:
- Pronóstico y previsión de valores futuros - Para negociar con éxito, necesitaremos predecir con precisión los precios futuros de los activos, al menos en un sentido estadístico.
- Una vez que identificamos las propiedades estadísticas de las series temporales financieras, podemos usarlas para generar simulaciones de escenarios futuros. Esto nos permite estimar el número de operaciones, los costos de negociación esperados, el perfil de rendimientos esperados, la inversión técnica y financiera requerida en infraestructura y, por lo tanto, en última instancia, el perfil de riesgo y la rentabilidad de una estrategia o cartera particular.
- Inferir relaciones - La identificación de las relaciones entre las series temporales y otros valores cuantitativos nos permite mejorar nuestras señales de negociación a través de mecanismos de filtración. Por ejemplo, si podemos inferir cómo el spread en un par de divisas varía con el volumen de oferta / demanda, entonces podemos filtrar cualquier operación prospectiva que pueda ocurrir en un período en el que pronosticamos un amplio spread con el fin de reducir los costos de transacción.
Además, podemos aplicar pruebas estadísticas estándar (clásicas/frecuentistas o bayesianas) a nuestros modelos de series temporales para justificar ciertos comportamientos, como el cambio de régimen en los mercados de valores.
Software de análisis de series temporales
Hasta la fecha hemos hecho casi exclusivamente uso de C ++ y Python para nuestra implementación de estrategia de comercio. Ambos lenguajes son entornos de primera clase para escribir una pila de comercio completa. Ambos contienen muchas bibliotecas y permiten una construcción de extremo a extremo de un sistema de comercio únicamente dentro de ese lenguaje.
Desafortunadamente, C++ y Python no poseen extensas bibliotecas estadísticas. Esta es una de sus deficiencias. Por esta razón, utilizaremos el entorno estadístico R como un medio para llevar a cabo la investigación de series temporales. R es adecuado para el trabajo debido a la disponibilidad de bibliotecas de series temporales, métodos estadísticos y capacidades de trazado sencillas.
Aprenderemos R de una manera de resolución de problemas, por lo que se introducirán nuevos comandos y sintaxis según sea necesario.
QuantStart Análisis de series de tiempo Mapa de ruta
Los artículos anteriores hasta la fecha sobre los temas de aprendizaje estadístico, econometría y análisis bayesiano, han sido en su mayoría de carácter introductorio y no han considerado las aplicaciones de tales técnicas a la información de precios moderna y de alta frecuencia.
Para aplicar algunas de las técnicas anteriores a los datos de mayor frecuencia necesitamos un marco matemático en el que unificar nuestra investigación.
Finalmente, utilizaremos herramientas bayesianas y técnicas de aprendizaje automático junto con los siguientes métodos para pronosticar el nivel y la dirección de los precios, actuar como filtros y determinar el cambio de régimen, es decir, determinar cuándo nuestras series temporales han cambiado su comportamiento estadístico subyacente.
Nuestra hoja de ruta de series temporales es la siguiente. Cada uno de los temas a continuación formará su propio artículo o conjunto de artículos. Una vez que hayamos examinado estos métodos en profundidad, estaremos en condiciones de crear algunos modelos modernos sofisticados para examinar datos de alta frecuencia.
- Introducción a las series temporales - Este artículo describe el área del análisis de series temporales, su alcance y cómo se puede aplicar a los datos financieros.
- Correlación - Un aspecto absolutamente fundamental del modelado de series de tiempo es el concepto de correlación serial.
- Pronóstico - En esta sección consideraremos el concepto de pronóstico, que es hacer predicciones de dirección o nivel futuro para una serie temporal particular, y cómo se lleva a cabo en la práctica.
- Modelos estocásticos - Hemos pasado algún tiempo considerando modelos estocásticos en el campo de los precios de las opciones en el sitio, a saber, con Movimiento Geométrico Browniano y Volatilidad Estocástica.
- Regresión - Cuando tenemos tendencias deterministas (en lugar de estocásticas) en los datos podemos justificar su extrapolación utilizando modelos de regresión.
- Modelos estacionarios - Los modelos estacionarios asumen que las propiedades estadísticas (es decir, la media y la varianza) de la serie son constantes en el tiempo.
- Muchas series temporales financieras son no estacionarias, es decir, tienen una media y una varianza variables. En particular, los precios de los activos a menudo tienen períodos de alta volatilidad.
- Modelado multivariado - Hemos considerado modelos multivariados en QuantStart en el pasado, a saber, cuando consideramos pares de acciones de inversión media. En esta sección definiremos más rigurosamente la cointegración y analizaremos más pruebas para ella. También consideraremos modelos autorregresivos vectoriales (VAR).
- Modelos de estado-espacio - El modelado de espacio de estado toma prestada una larga historia de la teoría de control moderna utilizada en ingeniería para permitirnos modelar series de tiempo con parámetros rápidamente variables (como la variable de pendiente β entre dos activos cointegrados en una regresión lineal). En particular, consideraremos el famoso filtro de Kalman y el modelo de Markov oculto. Este será uno de los principales usos del análisis bayesiano en series de tiempo.