Lista de pedidos baseada em aprendizado de máquina estratégias de negociação de alta frequência

Autora:Inventor quantificado - sonho pequeno, Criado: 2016-11-16 16:52:38, Atualizado: 2016-11-16 16:55:18

Lista de pedidos baseada em aprendizado de máquina estratégias de negociação de alta frequência

  • ### A teoria do tempo Os mecanismos de negociação dos mercados de valores podem ser divididos em dois tipos: mercados orientados por ofertas e mercados orientados por ordens. Os primeiros dependem de agentes de mercado para fornecer liquidez, os últimos fornecem liquidez por meio de pedidos de preços limitados, e as transações são formadas por compras e compras de investidores. Os mercados de valores da China são orientados por ordens, incluindo o mercado de ações e o mercado de futuros.

基于机器学习的订单簿高频交易策略Gráfico 1 Mapas de mercado impulsionados por pedidos

  • (I) Resumo da lista de pedidos de preços limitados

    O estudo do livro de pedidos pertence à categoria de estudo da estrutura microscópica do mercado. A teoria da estrutura microscópica do mercado tem como fonte de pensamento a teoria dos preços e a teoria dos fornecedores na microeconomia, e em sua análise do processo e das causas da transação de ativos financeiros e seus processos de formação de preços, utiliza várias teorias e métodos, como equilíbrio geral, equilíbrio local, ganhos marginais, custos marginais, continuidade do mercado, teoria dos estoques, teoria dos jogos, economia da informação e outros.

    De acordo com o progresso da pesquisa estrangeira, o campo da estrutura microscópica do mercado é representado por O Hara, onde a maioria das teorias é baseada em mercados de comércio (ou seja, mercados impulsionados por ofertas), como modelos de estoque e modelos de informação, etc. No ano passado, os mercados de negociação reais foram gradualmente dominados pelo impulsionamento de pedidos, mas há menos pesquisas dedicadas aos mercados impulsionados por pedidos.

    Os mercados domésticos de valores mobiliários e de futuros pertencem ao mercado orientado por ordens. O gráfico a seguir é um esquema do Livro de Ordens do Nível 1 do IF1312 de contratos de futuros de índices de ações. Não há muita informação obtida diretamente a partir dele, as informações básicas incluem um preço de compra, um preço de venda, um volume de compra e um volume de venda.

    基于机器学习的订单簿高频交易策略Gráfico 2 Livro de pedidos de contratos principais de futuros do índice de ações Nível-1

  • (B) Progressos na pesquisa de transações de alta frequência no livro de pedidos

    A modelagem dinâmica da carteira de pedidos tem dois métodos principais, um é o método econômico de medição clássico e o outro é o método de aprendizagem de máquina. O método econômico de medição é um método de pesquisa clássico e dominante, como a análise de diferenças de preços, a análise de MRR, a análise de Huang e Stoll, o modelo ACD de duração de pedidos e o modelo logístico de previsão de preços.

    A pesquisa acadêmica em aprendizagem de máquina também é muito ativa no campo financeiro, como o estudo de 2012 Forecasting trends of high_frequency KOSPI200 index data using learning classifiers. A pesquisa é uma idéia comum que usa indicadores comuns de análise técnica (MA, EMA, RSI, etc.) para fazer previsões de mercado, introduzindo métodos classificativos de aprendizagem de máquina.

  • Aplicações de aprendizagem de máquina em transações de alta frequência no livro de pedidos

    • #### (I) Arquitetura do sistema O gráfico abaixo é uma arquitetura de sistema de uma estratégia de negociação de aprendizagem de máquina típica, que inclui dados de livro de pedidos, descoberta de características, construção e verificação de modelos e vários módulos principais de oportunidades de negociação. É importante ressaltar que o processo de negociação é desencadeado por eventos de mercado, sendo a chegada do mercado de ticks um desses eventos.

    基于机器学习的订单簿高频交易策略Figura 3 Arquitetura de sistemas baseada em aprendizado de máquina para modelagem de carteiras de pedidos

    • #### (B) Suporte vector de apresentação Nos anos 1970, Vapnik e outros começaram a construir um sistema de teorias comparativamente perfeito para a teoria do aprendizado estatístico (SLT, Statistical Learning Theory), que é usado para estudar a regularidade estatística e a natureza do método de aprendizagem em situações de amostra limitada, estabelecendo um bom quadro teórico para problemas de aprendizagem de máquina de amostra limitada, resolvendo melhor problemas reais como pequenas amostras, não-linearidades, números de alta dimensão e extremos locais. Em 1995, Vapnik e outros explicaram um novo método de aprendizagem geral que apoiava o vector gerador de massa (SVM, Support Vector Machine).

    O SVM evoluiu a partir de um superplano de classificação ideal em uma condição linear divisível. Para dois tipos de problemas de classificação, o conjunto de amostras de treinamento é definido como ((xi,yi), i = 1,2... l, l é o número de indivíduos da amostra de treinamento, xi é a amostra de treinamento, yi pertence a {-1+,1} é o marcador de classe da amostra de entrada xi (exit esperado).

    O superplano de classificação ideal não só separa corretamente todas as amostras (a taxa de erro de treinamento é 0), mas também é capaz de maximizar a margem entre as duas classes, definida como a soma da distância mínima do conjunto de dados de treinamento até o superplano de classificação. O superplano de classificação ideal significa o menor erro de classificação médio nos dados do teste.

    Se houver um superplano no espaço de vectores de dimensão d:

    F ((x) = w*x+b=0

    Para separar esses dois tipos de dados, o superplano é chamado de interface de divisão; onde w * x é o interior dos dois vetores w e x em um espaço de vetores d.

    Se a interface for dividida:

    w*x+b=0

    A interfaz de segmentação é chamada de interfaz de segmentação ideal quando a distância entre as duas amostras mais próximas da interfaz é maior.

    基于机器学习的订单簿高频交易策略Diagrama 4 Interface gráfica do SVM binário

    A integração de uma equação de interface ideal permite que a distância entre as duas classes de amostras seja

    基于机器学习的订单簿高频交易策略

    Então, para qualquer amostra,

    基于机器学习的订单簿高频交易策略

    Para obter a melhor interface, você deve minimizar além de satisfazer a fórmula acima.

    Assim, o modelo matemático do problema SVM é:基于机器学习的订单簿高频交易策略

    O SVM acabou se tornando um problema de planejamento otimizado, com foco acadêmico em soluções rápidas, divulgação em múltiplas categorias, aplicação de problemas práticos, etc.

    O SVM foi originalmente proposto para problemas de binomial e, de acordo com as necessidades de aplicação atuais, foi ampliado para problemas de multiclasse. Algoritmos de multiclasse existentes incluem um-para-muitos, um-para-um, codificação de erros, DAG-SVM e o classificador SVM de classe multi i.

    • #### (III) Indicadores da lista de pedidos extraídos Como exemplo do mercado de futuros de índices de ações Level-1, o livro de pedidos inclui principalmente indicadores básicos como preço de compra, preço de venda, volume de compra e volume de venda, e pode derivar indicadores como profundidade, inclinação, diferença de preço, outros indicadores incluem volume de posições, volume de negociação, margem, etc., num total de 17 indicadores, como mostrado na tabela abaixo. Também podem ser introduzidos indicadores de análise técnica comuns como RSI, KDJ, MA, EMA, etc.

    Tabela 1 Base de indicadores baseados no Livro de Ordens de Mercado de Nível

    基于机器学习的订单簿高频交易策略

    • #### (IV) Características dinâmicas do livro de pedidos e oportunidades de negociação Do ponto de vista microscópico do mercado, existem dois métodos para medir a movimentação de preços em curto prazo, um é o movimento de preço intermediário e o outro é o cruzamento de preços.

    基于机器学习的订单簿高频交易策略

    De acordo com o tamanho da variação do preço médio ΔP no livro de pedidos em Δt, a variação é dividida em três categorias.

    O gráfico abaixo mostra a distribuição do movimento do preço médio do IF1311 no dia 29 de outubro, com 32 400 ticks por dia.

    No caso de Δt = 1 tick, o valor absoluto da variação do preço médio é 0.2 cerca de 6000 vezes, o valor absoluto da variação é 0.4 cerca de 1500 vezes, o valor absoluto da variação é 0.6 cerca de 150 vezes, o valor absoluto da variação é 0.8 maior que 50 vezes e o valor absoluto da variação é maior que 1 cerca de 10 vezes.

    No caso de Δt = 2 ticks, o valor absoluto da variação do preço médio é de 0.2 cerca de 7000 vezes, o valor absoluto da variação é de 0.4 cerca de 3000 vezes, o valor absoluto da variação é de 0.6 cerca de 550 vezes, o valor absoluto da variação é de 0.8 cerca de 205 vezes e o valor absoluto da variação é maior que 1 cerca de 10 vezes.

    Consideramos uma oportunidade potencial quando o valor absoluto da mudança é maior que 0,4. Em caso de Δt = 1 tick, há cerca de 1700 oportunidades por dia; Em caso de Δt = 2 ticks, há cerca de 4000 oportunidades por dia.

    基于机器学习的订单簿高频交易策略

    Figura 5 IF1311 Diagrama da variação do preço médio em 29 de outubro (Δt = 1 tick)

    基于机器学习的订单簿高频交易策略

    Figura 6 IF1311 Distribuição da variação do preço médio em 29 de outubro (Δt = 2 tick)

  • Terceiro, comprovação estratégica.

    Como o modelo SVM tem uma alta complexidade de treinamento em uma grande amostra e um longo tempo de treinamento, escolhemos dados históricos de mercado com um intervalo de tempo relativamente curto para verificar a eficácia do modelo, com o exemplo dos dados de mercado de nível 1 do contrato IF1311 em outubro.

    • #### (I) Exame de efeitos do modelo Ciclo de dados: dados do mercado de contratos IF1311 em outubro;

    Variação de Δt: Quanto menor for o Δt, maior será a exigência de detalhes de transação. Quando Δt = 1 tick, é difícil obter ganhos na transação real. Para comparar os efeitos do modelo, aqui são avaliados 1 tick, 2 tick e 3 tick, respectivamente.

    Indicadores de avaliação do modelo: precisão da amostra, precisão do teste, tempo de previsão.基于机器学习的订单簿高频交易策略Tabela 2 Efeitos de 1 tick em dados de 1 tick

    基于机器学习的订单簿高频交易策略Tabela 3 prevê o efeito do tick 2 com dados de 1 tick

    基于机器学习的订单簿高频交易策略Tabela 4 Efeitos de 2 ticks com dados de 2 ticks

    A partir dos dados das três tabelas acima, podemos tirar algumas conclusões: A maior precisão é de cerca de 70%, e a precisão de 60% pode ser traduzida em estratégias de negociação.

    • #### (B) Estratégias para simular o lucro Por exemplo, no dia 31 de outubro, nós fizemos uma negociação simulada, onde a taxa de negociação de futuros de ações de uma instituição é geralmente zero.2610000Suponhamos que o número de transações não tenha um limite de fechamento, assumindo que o preço de giro unilateral seja de 0,2 pontos por cada transação e o número de mãos individuais seja de 1 mão por cada transação.

    Tabela 5 Estratégias de simulação de transações em 31 de outubro基于机器学习的订单簿高频交易策略

    O número de transações no dia inteiro foi de 605 vezes, incluindo procedimentos, 339 vezes de lucro, taxa de vitória de 56%, lucro líquido de 11814.99 yuan.

    O preço de deslizamento teórico é de US $ 14.520, que é a chave para a estratégia real. Se os detalhes do pedido forem controlados com mais precisão, o preço de deslizamento pode ser reduzido e o lucro líquido aumentado. Se o controle dos detalhes do pedido for inadequado ou as flutuações do mercado forem anormais, o preço de deslizamento será maior, enquanto o lucro líquido diminuirá, portanto, o sucesso das negociações de alta frequência geralmente depende da execução dos detalhes.

    Figura 7 Resultados da estratégia simulada em 31 de outubro基于机器学习的订单簿高频交易策略

Declaração de origem: O autor do artigo é o francês Jean-Marie Le Pen.


Mais informações

Evan1987O que você está fazendo aqui é muito ruim.