Gráfico 1 Mapas de mercado impulsionados por pedidos
O estudo do livro de pedidos pertence à categoria de estudo da estrutura microscópica do mercado. A teoria da estrutura microscópica do mercado tem como fonte de pensamento a teoria dos preços e a teoria dos fornecedores na microeconomia, e em sua análise do processo e das causas da transação de ativos financeiros e seus processos de formação de preços, utiliza várias teorias e métodos, como equilíbrio geral, equilíbrio local, ganhos marginais, custos marginais, continuidade do mercado, teoria dos estoques, teoria dos jogos, economia da informação e outros.
De acordo com o progresso da pesquisa estrangeira, o campo da estrutura microscópica do mercado é representado por O
Os mercados domésticos de valores mobiliários e de futuros pertencem ao mercado orientado por ordens. O gráfico a seguir é um esquema do Livro de Ordens do Nível 1 do IF1312 de contratos de futuros de índices de ações. Não há muita informação obtida diretamente a partir dele, as informações básicas incluem um preço de compra, um preço de venda, um volume de compra e um volume de venda.
Gráfico 2 Livro de pedidos de contratos principais de futuros do índice de ações Nível-1
A modelagem dinâmica da carteira de pedidos tem dois métodos principais, um é o método econômico de medição clássico e o outro é o método de aprendizagem de máquina. O método econômico de medição é um método de pesquisa clássico e dominante, como a análise de diferenças de preços, a análise de MRR, a análise de Huang e Stoll, o modelo ACD de duração de pedidos e o modelo logístico de previsão de preços.
A pesquisa acadêmica em aprendizagem de máquina também é muito ativa no campo financeiro, como o estudo de 2012 Forecasting trends of high_frequency KOSPI200 index data using learning classifiers. A pesquisa é uma idéia comum que usa indicadores comuns de análise técnica (MA, EMA, RSI, etc.) para fazer previsões de mercado, introduzindo métodos classificativos de aprendizagem de máquina.
Figura 3 Arquitetura de sistemas baseada em aprendizado de máquina para modelagem de carteiras de pedidos
O SVM evoluiu a partir de um superplano de classificação ideal em uma condição linear divisível. Para dois tipos de problemas de classificação, o conjunto de amostras de treinamento é definido como ((xi,yi), i = 1,2... l, l é o número de indivíduos da amostra de treinamento, xi é a amostra de treinamento, yi pertence a {-1+,1} é o marcador de classe da amostra de entrada xi (exit esperado).
O superplano de classificação ideal não só separa corretamente todas as amostras (a taxa de erro de treinamento é 0), mas também é capaz de maximizar a margem entre as duas classes, definida como a soma da distância mínima do conjunto de dados de treinamento até o superplano de classificação. O superplano de classificação ideal significa o menor erro de classificação médio nos dados do teste.
Se houver um superplano no espaço de vectores de dimensão d:
F ((x) = w*x+b=0
Para separar esses dois tipos de dados, o superplano é chamado de interface de divisão; onde w * x é o interior dos dois vetores w e x em um espaço de vetores d.
Se a interface for dividida:
w*x+b=0
A interfaz de segmentação é chamada de interfaz de segmentação ideal quando a distância entre as duas amostras mais próximas da interfaz é maior.
Diagrama 4 Interface gráfica do SVM binário
A integração de uma equação de interface ideal permite que a distância entre as duas classes de amostras seja
Então, para qualquer amostra,
Para obter a melhor interface, você deve minimizar além de satisfazer a fórmula acima.
Assim, o modelo matemático do problema SVM é:
O SVM acabou se tornando um problema de planejamento otimizado, com foco acadêmico em soluções rápidas, divulgação em múltiplas categorias, aplicação de problemas práticos, etc.
O SVM foi originalmente proposto para problemas de binomial e, de acordo com as necessidades de aplicação atuais, foi ampliado para problemas de multiclasse. Algoritmos de multiclasse existentes incluem um-para-muitos, um-para-um, codificação de erros, DAG-SVM e o classificador SVM de classe multi i.
Tabela 1 Base de indicadores baseados no Livro de Ordens de Mercado de Nível
De acordo com o tamanho da variação do preço médio ΔP no livro de pedidos em Δt, a variação é dividida em três categorias.
O gráfico abaixo mostra a distribuição do movimento do preço médio do IF1311 no dia 29 de outubro, com 32 400 ticks por dia.
No caso de Δt = 1 tick, o valor absoluto da variação do preço médio é 0.2 cerca de 6000 vezes, o valor absoluto da variação é 0.4 cerca de 1500 vezes, o valor absoluto da variação é 0.6 cerca de 150 vezes, o valor absoluto da variação é 0.8 maior que 50 vezes e o valor absoluto da variação é maior que 1 cerca de 10 vezes.
No caso de Δt = 2 ticks, o valor absoluto da variação do preço médio é de 0.2 cerca de 7000 vezes, o valor absoluto da variação é de 0.4 cerca de 3000 vezes, o valor absoluto da variação é de 0.6 cerca de 550 vezes, o valor absoluto da variação é de 0.8 cerca de 205 vezes e o valor absoluto da variação é maior que 1 cerca de 10 vezes.
Consideramos uma oportunidade potencial quando o valor absoluto da mudança é maior que 0,4. Em caso de Δt = 1 tick, há cerca de 1700 oportunidades por dia; Em caso de Δt = 2 ticks, há cerca de 4000 oportunidades por dia.
Figura 5 IF1311 Diagrama da variação do preço médio em 29 de outubro (Δt = 1 tick)
Figura 6 IF1311 Distribuição da variação do preço médio em 29 de outubro (Δt = 2 tick)
Como o modelo SVM tem uma alta complexidade de treinamento em uma grande amostra e um longo tempo de treinamento, escolhemos dados históricos de mercado com um intervalo de tempo relativamente curto para verificar a eficácia do modelo, com o exemplo dos dados de mercado de nível 1 do contrato IF1311 em outubro.
Variação de Δt: Quanto menor for o Δt, maior será a exigência de detalhes de transação. Quando Δt = 1 tick, é difícil obter ganhos na transação real. Para comparar os efeitos do modelo, aqui são avaliados 1 tick, 2 tick e 3 tick, respectivamente.
Indicadores de avaliação do modelo: precisão da amostra, precisão do teste, tempo de previsão.Tabela 2 Efeitos de 1 tick em dados de 1 tick
Tabela 3 prevê o efeito do tick 2 com dados de 1 tick
Tabela 4 Efeitos de 2 ticks com dados de 2 ticks
A partir dos dados das três tabelas acima, podemos tirar algumas conclusões: A maior precisão é de cerca de 70%, e a precisão de 60% pode ser traduzida em estratégias de negociação.
Tabela 5 Estratégias de simulação de transações em 31 de outubro
O número de transações no dia inteiro foi de 605 vezes, incluindo procedimentos, 339 vezes de lucro, taxa de vitória de 56%, lucro líquido de 11814.99 yuan.
O preço de deslizamento teórico é de US $ 14.520, que é a chave para a estratégia real. Se os detalhes do pedido forem controlados com mais precisão, o preço de deslizamento pode ser reduzido e o lucro líquido aumentado. Se o controle dos detalhes do pedido for inadequado ou as flutuações do mercado forem anormais, o preço de deslizamento será maior, enquanto o lucro líquido diminuirá, portanto, o sucesso das negociações de alta frequência geralmente depende da execução dos detalhes.
Figura 7 Resultados da estratégia simulada em 31 de outubro
Declaração de origem: O autor do artigo é o francês Jean-Marie Le Pen.
Evan1987O que você está fazendo aqui é muito ruim.