Lista de pedidos basada en aprendizaje automático estrategias de operaciones de alta frecuencia

El autor:Los inventores cuantifican - sueños pequeños, Creado: 2016-11-16 16:52:38, Actualizado: 2016-11-16 16:55:18

Lista de pedidos basada en aprendizaje automático estrategias de operaciones de alta frecuencia

  • ### No, no lo sé. El mecanismo de negociación del mercado de valores se puede dividir en dos tipos: el mercado impulsado por la oferta y el mercado impulsado por la orden. El primero depende de los operadores para proporcionar liquidez, el segundo proporciona liquidez a través de la oferta de precios limitados, y las transacciones se forman a través de las ofertas de compra y venta por encargo de los inversores.

基于机器学习的订单簿高频交易策略Diagrama 1 del mercado impulsado por las órdenes

  • (a) Presentación del libro de pedidos de precios limitados

    El estudio del libro de pedidos pertenece a la categoría de investigación de la estructura microscópica del mercado, y la teoría de la estructura microscópica del mercado utiliza la teoría de precios y la teoría de los fabricantes en microeconomía como fuente de ideas, y en el análisis de sus problemas centrales, el equilibrio general, el equilibrio local, los beneficios marginales, los costos marginales, la continuidad del mercado, la teoría de las existencias, la teoría de juegos, la economía de la información y otros métodos.

    Desde el progreso de la investigación en el extranjero, el campo de la estructura microscópica del mercado está representado por OHara, y la mayoría de las teorías se basan en el mercado comercial (es decir, el mercado impulsado por la oferta), como el modelo de inventario y el modelo de información, etc. En los últimos años, el mercado de transacciones reales ha ido tomando un lugar cada vez más importante, pero hay menos investigación dedicada al mercado impulsado por la orden.

    Los mercados de valores y futuros nacionales pertenecen a los mercados impulsados por las órdenes. La siguiente imagen es una captura de pantalla del libro de pedidos de nivel 1 del contrato de futuros de índices de valores IF1312. No hay mucha información obtenida directamente de arriba, la información básica incluye un precio de compra, un precio de venta, una cantidad de compra y una cantidad de venta. En algunos artículos académicos en el extranjero, y el libro de pedidos correspondiente, también hay un libro de información, incluyendo los datos más detallados de toma de pedidos, incluyendo el volumen de pedidos, el precio realizado, el tipo de pedidos de cada pedido, etc.

    基于机器学习的订单簿高频交易策略Gráfico 2 Compromiso principal de futuros de índices de acciones Livro de pedidos de nivel 1

  • (B) Los avances en el estudio de la transacción de alta frecuencia en el libro de pedidos

    El modelo dinámico de la libreta de pedidos tiene dos métodos principales: el método clásico de la economía de la medición y el método de aprendizaje automático. El método de la economía de la medición es uno de los métodos de investigación clásicos de la corriente principal, como la descomposición de MRR para el análisis de diferencias de precios, la descomposición de Huang y Stoll, el modelo de ACD para la duración de los pedidos y el modelo logístico para la predicción de precios.

    La investigación académica sobre el aprendizaje automático en el campo financiero también es muy activa, como el estudio de 2012 Forecasting trends of high_frequency KOSPI200 index data using learning classifiers. El estudio de 2012 es una idea común que utiliza indicadores comunes de análisis técnico (MA, EMA, RSI, etc.) para introducir métodos de clasificación de aprendizaje automático para hacer predicciones de mercado.

  • Aplicaciones del aprendizaje automático en las transacciones de alta frecuencia de libros de pedidos

    • #### (I) Arquitectura del sistema El siguiente gráfico es la arquitectura del sistema de una estrategia de negociación típica de aprendizaje automático, que incluye datos de libros de pedidos, descubrimiento de características, construcción y verificación de modelos y varios módulos principales de oportunidades de negociación.

    基于机器学习的订单簿高频交易策略Figura 3 Arquitectura del sistema basado en el aprendizaje automático para la modelación de libros de pedidos

    • #### (B) Apoyo a la maquinaria de vectores En la década de 1970, Vapnik y otros comenzaron a construir un sistema teórico más completo de teoría del aprendizaje estadístico (SLT, Statistical Learning Theory), que se utiliza para estudiar la regularidad estadística y la naturaleza de los métodos de aprendizaje en casos de muestras limitadas, estableciendo un buen marco teórico para los problemas de aprendizaje de máquinas de muestras limitadas, que resuelve mejor problemas reales como muestras pequeñas, no lineales, de alta dimensión y extremos locales. En 1995, Vapnik y otros propusieron claramente un nuevo método de aprendizaje general que apoya la vectorización de la máquina de soporte (SVM, Support Vector Machine).

    El SVM se desarrolló a partir de superplanas de clasificación óptima en el caso de divisibilidad lineal. Para los dos tipos de problemas de clasificación, el conjunto de muestras de entrenamiento se configura como ((xi,yi), i = 1,2... l, l es el número de individuos de la muestra de entrenamiento, xi es la muestra de entrenamiento, yi pertenece a {-1+,1} es el marcado de clase de la muestra de entrada xi (la salida esperada).

    El superplano de clasificación óptimo no solo separa correctamente todas las muestras (por ejemplo, el error de entrenamiento es 0), sino que también puede hacer que el margen entre las dos clases sea mayor, definido como la suma de la distancia mínima del conjunto de datos de entrenamiento al superplano de clasificación. El superplano de clasificación óptimo significa el menor error de clasificación promedio en los datos de prueba.

    Si existe un superplano en el espacio vectorial de dimensiones d:

    F ((x) = w * x + b = 0

    Para poder separar los dos tipos de datos anteriores, el superplano se llama interfaz de división. Aquí w * x es el interior de los dos vectores w y x en el espacio de vectores en d dimensiones.

    Si la interfaz está dividida:

    w*x+b=0

    La interfaz que puede hacer que la distancia entre las dos clases de muestras más cercanas a la interfaz sea la mayor se llama interfaz de la interfaz de la interfaz.

    基于机器学习的订单簿高频交易策略Diagrama de la interfaz de la clasificación de SVM en las categorías binarias.

    La homogeneización de las ecuaciones de interfaz óptima permite que las distancias entre dos clases de muestras

    基于机器学习的订单簿高频交易策略

    Así que para cualquier muestra,

    基于机器学习的订单簿高频交易策略

    Para obtener la mejor interfaz, además de satisfacer la fórmula anterior, también se debe minimizar.

    Por lo tanto, el modelo matemático del problema SVM es:基于机器学习的订单簿高频交易策略

    El SVM finalmente se convirtió en un problema de planificación optimizado, y el foco de investigación del mundo académico se centró principalmente en la solución rápida, la difusión a múltiples categorías, la aplicación de problemas prácticos, etc.

    El SVM fue propuesto originalmente para problemas de clasificación binaria, y según las necesidades actuales de aplicación, se ha ampliado a problemas de multiclasificación. Los algoritmos multiclasificadores existentes incluyen uno-para-mucho, uno-para-uno, codificación de errores, DAG-SVM y el clasificador SVM de clase i.

    • #### (III) extracción de indicadores del libro de pedidos Por ejemplo, en el mercado de futuros de índices de acciones de nivel 1, el libro de pedidos incluye principalmente indicadores básicos como precio de compra, precio de venta, volumen de compra y volumen de venta, y puede derivar indicadores como profundidad, inclinación, diferencia de precio relativa, otros indicadores incluyen volumen de tenencia, volumen de transacción, margen, etc., un total de 17 indicadores, como se muestra en la tabla siguiente. También se pueden introducir indicadores de análisis técnico comunes como RSI, KDJ, MA, EMA, etc.

    Tabla 1 Base de indicadores basados en el libro de pedidos de nivel

    基于机器学习的订单簿高频交易策略

    • #### (Cuatro) Características dinámicas del libro de pedidos y oportunidades de negociación Desde el punto de vista microscópico del mercado, hay dos métodos para medir la movilidad de los precios en el corto plazo, uno es el movimiento de los precios intermedios y el otro es el cruce de precios.

    基于机器学习的订单簿高频交易策略

    Según la magnitud de la variación de la ΔP en el precio intermedio en la libreta de pedidos en Δt, se divide en tres categorías.

    El siguiente gráfico muestra la distribución de la movilidad de los precios intermedios de los principales contratos IF1311 el 29 de octubre, con 32400 ticks diarios.

    En el caso de Δt = 1 tick, el cambio absoluto del precio intermedio de 0.2 es de aproximadamente 6000 veces, el cambio absoluto de 0.4 es de aproximadamente 1500 veces, el cambio absoluto de 0.6 es de aproximadamente 150 veces, el cambio absoluto de 0.8 es mayor a 50 veces y el cambio absoluto de 1 es mayor a aproximadamente 10 veces.

    En el caso de Δt = 2 ticks, el cambio absoluto del precio intermedio de 0.2 es de aproximadamente 7000 veces, el cambio absoluto de 0.4 es de aproximadamente 3000 veces, el cambio absoluto de 0.6 es de aproximadamente 550 veces, el cambio absoluto de 0.8 es de aproximadamente 205 veces, y el cambio absoluto es mayor o igual a 1 es de aproximadamente 10 veces.

    Consideramos que el valor absoluto de la variación es mayor que 0.4 cuando es igual a 0,4 y es una oportunidad de negociación potencial. En el caso de Δt = 1 tick, hay aproximadamente 1700 oportunidades por día; en el caso de Δt = 2 ticks, hay aproximadamente 4000 oportunidades por día.

    基于机器学习的订单簿高频交易策略

    Figura 5 IF1311 Diagrama de cambios en el precio medio el 29 de octubre ((Δt=1 tick)

    基于机器学习的订单簿高频交易策略

    Figura 6 IF1311 Diagrama de cambios en el precio medio el 29 de octubre ((Δt=2 tick)

  • La tercera prueba estratégica.

    Debido a la alta complejidad de la capacitación y el largo tiempo de capacitación del modelo SVM en casos de grandes muestras, elegimos datos históricos de mercado con un lapso de tiempo relativamente corto para verificar la eficacia del modelo, con los datos de mercado de nivel 1 del contrato IF1311 en octubre.

    • #### (1) Prueba de los efectos del modelo Ciclo de datos: datos del mercado de los contratos IF1311 en octubre;

    Para comparar los efectos del modelo, aquí se valoran 1 tick, 2 tick y 3 tick, respectivamente.

    Los indicadores de evaluación del modelo: exactitud de la muestra, exactitud de la prueba, tiempo de predicción.基于机器学习的订单簿高频交易策略Tabla 2 El efecto de un tick en la predicción de datos de 1 tick

    基于机器学习的订单簿高频交易策略Tabla 3 para predecir el efecto del tick 2 con datos de 1 tick

    基于机器学习的订单簿高频交易策略Tabla 4 El efecto de las predicciones de 2 ticks con datos de 2 ticks

    De los datos de las tres tablas anteriores, podemos llegar a las siguientes conclusiones: La máxima precisión es de aproximadamente 70%, y la precisión de 60% se puede traducir en una estrategia de negociación.

    • #### (B) estrategias para simular las ganancias Por ejemplo, el 31 de octubre, realizamos una operación simulada, donde las tarifas de transacción de futuros de acciones de las instituciones son generalmente de 0.2610000Supongamos que el número de transacciones no tiene límite de cierre, supongamos que el precio de giro unilateral es de 0.2 puntos por cada operación y el número de manos individuales es de 1 mano por cada operación.

    Tabla 5 Estrategias de simulación de las transacciones del 31 de octubre基于机器学习的订单簿高频交易策略

    El número de transacciones durante el día fue de 605, incluidas las operaciones, el número de ganancias fue de 339, con una tasa de ganancia del 56%, y el beneficio neto fue de 11814.99 yuanes.

    El precio de giro teórico es de 14.520 yuanes, y esta parte es clave para la estrategia real. Si los detalles de la orden se controlan con más precisión, se puede reducir el precio de giro y aumentar los beneficios netos. Si el control de los detalles de la orden no es adecuado o si el mercado fluctúa de manera irregular, el precio de giro será mayor, mientras que los beneficios netos disminuirán, por lo que el éxito de las operaciones de alta frecuencia a menudo depende de la ejecución de los detalles.

    Diagrama 7 Las ganancias de las estrategias simuladas el 31 de octubre基于机器学习的订单簿高频交易策略

Declaración de origen: Este artículo fue escrito por el autor, y se puede traducir indicando la fuente.


Más contenido

Eván1987Goodwin, está aprendiendo a estudiar las órdenes de los bajos precios