Les ressources ont été chargées... Je charge...

La façon de penser est plus importante que les algorithmes à haute fréquence.

Auteur:L'inventeur de la quantification - un petit rêve, Créé: 2016-09-05 20:56:39, Mis à jour: 2016-09-05 21:32:59

La façon de penser est plus importante que les algorithmes à haute fréquence.

Ce qui a vraiment fait entrer le commerce programmatique dans la vue du public, c'est l'incident de l'Ural, un gros titre qui a choqué le marché il y a deux ans, lorsque l'indice a grimpé de plus de 5% en moins d'une minute en raison d'une erreur dans la génération et l'exécution des ordres dans le programme de trading hautement fréquent de l'ETF de ce courtier.

Depuis le nouveau régime de Xi 7•31 de la Bourse chinoise des contrats à terme financiers, jusqu'à l'annonce par la Bourse de Xiongnan de mesures restrictives pour trois lots de comptes, jusqu'à la récente modification de la transaction de T+0 de T+1 de T+0, le niveau de réglementation a continuellement ouvert une barrière à la transaction procédurale.

Cet article est tiré d'informations sur les algorithmes les plus populaires utilisés par les utilisateurs en août 2014 pour les transactions à haute fréquence.

Je ne suis pas d'accord avec ce point de vue. Les transactions sont d'abord les transactions elles-mêmes, qui ont leur propre signification économique. Ignorer cela et les voir simplement comme des jeux numériques qui ajoutent de la valeur à l'argent peut facilement vous faire perdre la tête.

Je ne pense pas non plus qu'il y ait quelque chose de rare dans les algorithmes eux-mêmes, que les meilleurs algorithmes sont morts, et que la vraie valeur centrale doit être celle des personnes qui les maîtrisent et les utilisent.

J'espère que cette réponse vous aidera à mieux comprendre la quantification et les transactions à haute fréquence.

Tout d'abord, je suis sûr que la conception que beaucoup de gens ont des transactions haute fréquence ressemble à ceci:

img

Mais pour les transactions à haute fréquence, cette information est très grossière. Je vais donc commencer par expliquer ce qu'est un livre d'ordres à ceux qui ne connaissent pas le contexte.

img

Bid représente l'acheteur et Offer représente le vendeur. Cette liste d'offres indique toutes les offres émises par les acheteurs et les vendeurs ("Limit Order"). Cette table est l'information qui intéresse le plus les transactions à haute fréquence. À tout moment, l'offre de l'acheteur est toujours inférieure à celle du vendeur (par exemple, ici 98 contre 101).

Quand une transaction se produit? Il y a deux situations, la première est l'émission d'un ordre de marché par l'une ou l'autre des parties, par exemple un acheteur émet un ordre de marché en un seul volume de 10 et achète 10 pièces du vendeur au prix de 101.

img

Deuxièmement, l'émission d'une liste de prix limitée équivaut à la meilleure offre de l'autre partie, ce qui produit le même résultat que dans le cas ci-dessus.

Il est important de souligner que, bien que le véritable Ordre Book n'existe qu'à l'intérieur de l'échange, et que toutes les transactions sont effectuées à l'intérieur de l'échange, l'échange transmet à tous chaque offre et chaque liste de prix, de sorte que tous les acheteurs et vendeurs peuvent maintenir eux-mêmes la même structure de données, ce qui correspond au miroir de l'Order Book de l'échange.

Après avoir présenté les bases, je vais utiliser une autre façon de représenter l'Ordre pour vous aider à comprendre:

img

Ce graphique correspond au livre d'ordres au début de l'article, et il devrait être clair que l'axe horizontal représente le prix, l'axe vertical représente la quantité d'ordres, le vert représente les acheteurs et le rouge représente les vendeurs.

On peut voir que les données de transaction dans les bourses sont totalement publiques, à tout moment sur le marché, qui veut acheter / vendre combien, tout le monde à première vue, il n'y a pas de secret. Cela a en soi un sens économique, car seulement en montrant la demande d'achat et de vente, attire les commerçants potentiels à négocier, donc dans le marché, un certain degré de divulgation de ses propres besoins est nécessaire.

img

Cela lui est très préjudiciable, car tout le monde utilise cette information pour lui faire du mal. On jugera qu'il y a maintenant une forte pression d'achat sur le marché et qu'il y a donc une foule de gens qui se précipitent pour gagner de l'argent, et les prix augmentent rapidement, de sorte que ce que cette personne peut acheter au prix de 98 devient rapidement plus cher. Je ne sais pas. Pour résoudre ce problème, les échanges proposent un outil ciblé, appelé ordre d'iceberg. Ces ordres peuvent être très importants, mais seulement une petite partie est rendue publique et la plupart sont cachés, comme un véritable iceberg, que personne d'autre que l'échange et l'émetteur ne voit.

La partie grise représente la partie cachée de l'ordre de l'iceberg. Ainsi, l'échange ne prévient les autres que lorsque des transactions correspondant à des quantités cachées se produisent, ce qui empêche les autres d'utiliser l'information affichée pour faire du front running.

Il y a des avantages et des inconvénients à tout. Les ordres de montagne de glace, bien que protégeant les intérêts de l'émetteur, deviennent une règle inéquitable pour les autres acteurs du marché. Les acteurs qui ont de véritables besoins commerciaux perdent énormément en raison d'une mauvaise appréciation de la situation.

Il y a d'abord la méthode la plus simple. Parfois, l'ordre d'un iceberg est suspendu entre le prix d'achat le plus favorable et le prix de vente, comme ceci:

img

Dans ce cas, une méthode de détection très simple consiste à émettre un ordre limité minimum dans le spread, suivi d'une annulation de l'ordre. Dans cet exemple, un ordre limité de 99 est émis et annulé, car le prix lui-même n'est pas le prix d'achat explicite. En l'absence d'un ordre glacial, il est nécessaire de négocier. Mais dans le cas d'un ordre glacial, une fois que le marché n'a pas reçu l'ordre de vente, il négocie immédiatement le montant correspondant à l'ordre glacial, et l'ordre d'annulation est annulé.

Pour lutter contre cette détection perturbatrice, les gens ne sont généralement pas directement liés à l'écart; mais ils sont comme avant liés à l'ordre de limitation ordinaire, de sorte qu'après une transaction, il est difficile de deviner si vous consommez un ordre de limitation ordinaire ou un ordre d'iceberg.

Tout d'abord, il y a une idée directe. L'existence d'un ordre de montagne reflète, dans une certaine mesure, l'interprétation de la situation du marché par l'acheteur, qui estime qu'il est nécessaire d'utiliser un ordre de montagne. Il faut souligner que l'utilisation d'un ordre de montagne n'est pas sans coût, car vous masquez les besoins réels, tout en masquant les attaquants potentiels, mais aussi les vrais traders! et cela augmente considérablement le temps de transaction - parce que personne ne sait que vous voulez acheter / vendre si lentement, vous ne pouvez attendre que lentement l'apparition de la manette.

Quel est le bon moment? Il y a des données qui devraient être pertinentes, comme le spread des prix, le rapport entre le nombre d'achats et le nombre d'ordres vendus, etc. Pour ces données, vous pouvez faire une analyse régressive sur les données historiques et construire un modèle linéaire / non linéaire entre elles et les ordres d'iceberg. Ce modèle, formé à partir des données historiques, peut servir de détecteur d'ordres d'iceberg que vous utilisez pour trader en temps réel.

Le modèle de base peut être défini comme suit: F ((spread, bidSize/offerSize,...) = Probability ((Iceberg)

Si vous voulez jouer à haute profondeur, vous pouvez également construire des modèles avancés tels que HMM, SVM, réseaux neuronaux, etc. sur cette base, mais l'idée de base est la même: calculer la probabilité d'une commande d'iceberg en utilisant l'analyse de plateau.

Cette méthode, qui semble très avancée, a-t-elle des effets réels? Je pense que vous avez tous vu que cette modélisation n'est pas très précise. C'est une bonne méthode d'analyse postérieure pour expliquer dans quelles circonstances un ordre de montagne d'iceberg pourrait apparaître, mais ce n'est pas très rassurant en tant que détecteur de transactions en temps réel.

C'est donc la méthode la plus réaliste pour obtenir des liquidités à haute fréquence qui est présentée ci-dessous, dans un article intitulé Prediction of Hidden Liquidity in the Limit Order Book of GLOBEX Futures.

  高频世界里,有一条永恒的建模准则值得铭记:先看数据再建模。如果你看了上面的介绍就开始天马行空的思考数学模型,那基本上是死路一条。我见过很多年轻人,
  特别有热情,一上来就开始做数学定义,然后推导偏微分方程,数学公式写满一摞纸,最后一接触数据才发现模型根本行不通,这是非常遗憾的。

Il est probable que les règles de l'échange soient très intéressantes pour le traitement des ordres de la montagne d'ice. Certains échanges le font ainsi: un ordre de la montagne d'ice contient deux paramètres, V indique le montant total de l'ordre et p indique le montant affiché publiquement. Par exemple, une liste de la montagne d'ice de V = 100, p = 10, la quantité cachée est en fait de 90 ; si une transaction est effectuée pour cette commande, par exemple, le volume de transaction 10, l'échange envoie trois messages dans l'ordre:

Compte rendu 10

Taille de l'offre la plus élevée pour le livre d'ordres -10

Une nouvelle offre +10

Ces trois messages doivent apparaître en continu, et le décalage entre le troisième et le premier article est très faible. La raison en est que, bien que les ordres d'iceberg aient des quantités cachées, chaque transaction n'a lieu que pour la quantité affichée (p) et qu'une nouvelle quantité de p n'est renouvelée que lorsque p est épuisée. Ainsi, les informations reçues par chaque échange peuvent toujours être logiquement correctement mises à jour dans le livre d'ordres, comme si les ordres d'iceberg n'existaient pas. Je ne sais pas. Ainsi, une fois que nous avons observé cette loi dans les données, nous pouvons déterminer avec une grande certitude l'existence d'un ordre de la montagne d'eau dans le marché, et la valeur de la connexion p peut être déterminée! La question clé suivante est de savoir comment déterminer la valeur de V, c'est-à-dire ce que le stock restant de cette commande de la montagne d'eau est. Je ne sais pas. Le problème ne peut pas être résolu avec précision, car V et p sont des valeurs arbitraires, décidées par l'individu lui-même. Mais on peut considérer deux points: premièrement, les deux valeurs sont des nombres entiers; deuxièmement, les humains ne sont pas des générateurs de nombres aléatoires parfaits, et les décisions suivent une certaine loi.

A partir de ces deux points, on peut construire un modèle de probabilité sur V et p, c'est-à-dire calculer quelle est la probabilité d'apparition d'une combinaison de valeurs V, p. Sans entrer dans l'analyse mathématique, les amis intéressés peuvent voir par eux-mêmes. En termes simples, on peut estimer la forme de leurs fonctions de densité de probabilité sur des données historiques à l'aide de techniques d'estimation du noyau.

img

Ainsi, lorsque vous observez une valeur de p dans les données en temps réel, vous pouvez obtenir une fonction de densité de probabilité conditionnelle de la valeur V correspondante, c'est-à-dire une section du graphique ci-dessus, par exemple ((p = 8):

img

Ensuite, il est évidemment facile de calculer quelle est la valeur la plus probable de V. Cette courbe fonctionnelle joue également un rôle important en vous aidant à évaluer dynamiquement le stock résiduel, par exemple, lorsque vous observez que 5 p ont déjà été épuisés, vous pouvez proposer V > = 40, et vous pouvez proposer une nouvelle valeur de V et un stock résiduel (V-5p) à partir du graphique ci-dessus.

img

Dans l'ensemble, l'essence de l'algorithme est de juger de l'existence d'un ordre d'iceberg en observant trois enregistrements pertinents qui apparaissent successivement sur une courte période de temps dans les données en temps réel, tandis que la quantification de l'ordre d'iceberg est effectuée à l'aide d'un modèle de probabilité formé à partir de données historiques.

Je suis sûr que vous verrez aussi que cet algorithme n'est pas une tromperie. C'est juste une spéculation basée sur des données publiques sur le marché. Et cette spéculation est basée uniquement sur la probabilité, ce qui devrait être une référence. Cela a du sens pour les fournisseurs de liquidité qui font du trading, ce qui leur permet d'éviter de subir des pertes en raison d'une mauvaise interprétation de la situation.

Enfin, l'algorithme est uniquement destiné à un échange spécifique. D'autres échanges peuvent ne pas utiliser la même méthode de traitement des commandes. Ce qui est donc vraiment précieux, c'est cette idée de modélisation basée sur des données réelles.

Ce petit algorithme vous montre le coin d'un iceberg dans le domaine du trading à haute fréquence. Cela peut sembler peu compliqué, mais j'aime parce qu'il montre clairement ce qu'on appelle d'abord une idée, puis une quantification.

Si vous allez à l'encontre de ce principe, vous allez tout de suite déplacer des modèles sophistiqués et vous attendre à ce qu'ils génèrent automatiquement des signaux de transaction, ce qui me semble être un rêve obsédé. Je suis très heureux d'avoir été invité.

Traduit de l'anglaisLes liens


Plus de