Стратегия высокочастотных торгов на основе машинного обучения

Автор:Изобретатели количественного измерения - мечты, Создано: 2016-11-16 16:52:38, Обновлено: 2016-11-16 16:55:18

Стратегия высокочастотных торгов на основе машинного обучения

  • ### Первый, тиоретический Торговые механизмы на рынке ценных бумаг могут быть разделены на два типа: рынок, управляемый предложениями, и рынок, управляемый заказами. Рынок, управляемый заказами, обеспечивает ликвидность через посредников, а рынок, управляемый заказами и заказами инвесторов.

基于机器学习的订单簿高频交易策略Диаграмма рынка, управляемого заказами

  • (I) Оригинальное описание списка заказов по цене

    Исследование ордерных книг относится к категории исследований микроструктуры рынка. Теория микроструктуры рынка использует в качестве источника своих идей теорию цен и теорию поставщиков в микроэкономике, а в анализе ее основных вопросов - торговли финансовыми активами и процессов и причин их формирования - использует различные теории и методы, такие как общий баланс, локальный баланс, предельная прибыль, предельные затраты, рыночная непрерывность, теория запасов, игровая теория, информационная экономика и другие.

    С точки зрения прогресса исследований за рубежом, область микроструктуры рынка, представленная в OHara, большая часть теорий основана на рынках торговли ("т.е. рынках, управляемых предложениями), таких как модели инвентаря и информационные модели и т. д. За последние годы на реальных торговых рынках заказное движение постепенно заняло верхнее место, но исследования, посвященные заказному движению рынков, были относительно незначительными.

    Внутренние фондовые и фьючерсные рынки являются рынками, управляемыми заказами. Ниже приведены скриншоты с рынка, сделанные на уровне 1 по Фьючерсному договору IF1312. Не так много информации, полученной непосредственно сверху, основная информация включает в себя цену покупки, цену продажи, количество покупки и количество продажи. В некоторых научных статьях за рубежом, и соответствующие ордерные книги имеются информационные книги, включая самые подробные данные сбора заказов, включая количество заказов, цены, которые были сделаны, типы заказов, и т. д.

    基于机器学习的订单簿高频交易策略Рисунок 2 Фьючерсные основные контракты на фондовом индексе

  • 2) Прогресс в исследовании высокочастотных сделок с книгой заказов

    В основном существуют два метода динамического моделирования ордерных книг: классический метод измерения и метод машинного обучения. Метод измерения является классическим основным методом исследования, например, MRR-разбивка для анализа разницы в ценах, Huang и Stoll-разбивка, ACD-модель продолжительности заказов и логистическая модель для прогнозирования цен.

    Академические исследования в области машинного обучения также очень активны в финансовой сфере, например, 2012 год. Forecasting trends of high_frequency KOSPI200 index data using learning classifiers. Это распространенная исследовательская идея, которая использует распространенные показатели технического анализа (MA, EMA, RSI и т. д.), чтобы внедрить классификационные методы машинного обучения для прогнозирования рынка.

  • Второе, применение машинного обучения в высокочастотных операциях с ордерными книгами

    • #### (I) Архитектура системы Ниже изображена системная архитектура типичных машинных обучающихся торговых стратегий, включающая в себя несколько основных модулей: данные ордерной книги, обнаружение характеристик, моделирование и проверка, а также торговые возможности.

    基于机器学习的订单簿高频交易策略Рисунок 3 Архитектура системы моделирования ордерных книг на основе машинного обучения

    • #### (II) Поддержка вектора В 1970-х годах Вапник и др. начали создавать более совершенную теоретическую систему статистической теории обучения (SLT, Statistical Learning Theory), которая используется для изучения статистических закономерностей и свойств методов обучения в условиях ограниченной выборки, создает хорошую теоретическую основу для задач машинного обучения с ограниченной выборкой и лучше решает практические проблемы, такие как малые образцы, нелинейность, высокомерные числа и локальные предельно-маленькие точки. В 1995 году Вапник и др. четко выдвинули новый универсальный метод обучения, поддерживающий вектора (SVM, Support Vector Machine).

    SVM развивается из оптимальной классификационной сверхплоскости при линейных делящихся условиях. Для двух типов классификационных задач набор тренировочных образцов устанавливается как ((xi,yi), i=1,2...l, l - число индивидуумов тренировочной выборки, xi - тренировочная выборка, yi принадлежит к {-1+,1} - классовым маркировкам входящей выборки xi ((ожидаемый выход).

    Оптимальная классификационная сверхплоскость не только позволяет правильно разделить все образцы, но и максимально увеличить разрыв между ними, который определяется как сумма минимального расстояния между тренировочным набором данных и этой классификационной сверхплоскостью. Оптимальная классификационная сверхплоскость означает наименьшее среднее расхождение в классификации тестовых данных.

    Если существует сверхплоскость в пространстве с движными измерениями:

    F ((x) = w*x+b=0

    Для того, чтобы отделить эти два типа данных, эта сверхплоскость называется интерфейсом деления. Здесь w * x - это внутреннее пространство двух векторов w и x в пространстве движённых векторов.

    Если интерфейс разделен:

    w*x+b=0

    Интерфейс, который позволяет максимально увеличить расстояние между двумя ближайшими к нему образцами, называется наиболее преимущественным интерфейсом.

    基于机器学习的订单簿高频交易策略Рисунок 4 SVM бинарный наиболее оптимальный интерфейс

    Упорядочение уравнений оптимальных интерфейсов позволяет сделать расстояние между двумя типами образцов

    基于机器学习的订单簿高频交易策略

    Так что для любого образца,

    基于机器学习的订单簿高频交易策略

    Для получения оптимального интерфейса, помимо выполнения вышеперечисленных формул, необходимо свести к минимуму.

    Таким образом, математическая модель проблемы SVM:基于机器学习的订单簿高频交易策略

    SVM в конечном итоге становится наиболее оптимизированной задачей планирования, а научные исследования сосредоточены на быстром решении, распространении в многоклассы, применении практических проблем и т. д.

    SVM был первоначально разработан для проблем с двумя классами, но в соответствии с требованиями современных практических приложений был расширен до проблем с многоклассами. Существующие алгоритмы многоклассов включают одно-по-одному, одно-по-одному, корректировку ошибок, DAG-SVM и многоклассный SVM-классификатор.

    • #### (III) Извлечение показателей с книг заказов В качестве примера рынка фондовых фьючерсов Level-1 ордерная книжка включает в себя основные показатели, такие как цена покупки, цена продажи, объем покупки, объем продажи, а также может выводить такие показатели, как глубина, склон, относительная дифференциация, другие показатели, такие как объем владения, объем торгов, ключевые значения и т. д., в общей сложности 17 показателей, как показано в таблице ниже.

    Таблица 1 База показателей, основанная на книге заказов на рынке Level

    基于机器学习的订单簿高频交易策略

    • #### (IV) Динамические характеристики и возможности торговли в книге заказов С микроскопической точки зрения рынка существуют два способа измерения ценового движения в короткие сроки, один из которых является промежуточным движением цены, а другой - ценовым пересечением разницы. В данной статье мы выберем более простой и понятный промежуточный движение цены.

    基于机器学习的订单簿高频交易策略

    В соответствии с размером изменения средней цены ΔP в книге заказов в Δt, она делится на три категории.

    Ниже приведен график распределения среднего движения цены основных контрактов IF1311 на 29 октября, с данными рынка 32400 тиков в день.

    В случае Δt=1 tick абсолютные значения изменения средней цены 0.2 примерно 6000 раз, изменения абсолютных значений 0.4 примерно 1500 раз, изменения абсолютных значений 0.6 примерно 150 раз, изменения абсолютных значений 0.8 примерно 50 раз, изменения абсолютных значений больше 1 примерно 10 раз.

    В случае Δt=2tick абсолютные значения изменения средней цены 0.2 примерно 7000 раз, изменения абсолютных значений 0.4 примерно 3000 раз, изменения абсолютных значений 0.6 примерно 550 раз, изменения абсолютных значений 0.8 примерно 205 раз, изменения абсолютных значений больше 1 примерно 10 раз.

    Мы считаем, что абсолютные значения изменений больше, чем 0,4, что является потенциальной возможностью торговли. При Δt = 1 тика, около 1700 возможностей в день; при Δt = 2 тика, около 4000 возможностей в день.

    基于机器学习的订单簿高频交易策略

    Рисунок 5 IF1311 Распределение изменений средней цены на 29 октября ((Δt=1 tick)

    基于机器学习的订单簿高频交易策略

    Рисунок 6 IF1311 Распределение изменений средней цены на 29 октября ((Δt=2 tick)

  • Третье: стратегические доказательства

    Поскольку обучение модели SVM в условиях большой выборки является более сложным и длительным, мы выбрали исторические отраслевые данные с относительно коротким периодом, чтобы проверить эффективность модели.

    • #### (1) Проверка эффекта модели Цикл данных: рыночные данные о контрактах IF1311 в октябре;

    Принятие значения Δt: чем меньше Δt, тем больше требований к деталям сделки, когда Δt = 1 тик, трудно получить прибыль в фактической сделке. Для сравнения эффекта модели, здесь, соответственно, принимается значение 1 тик, 2 тик, 3 тик;

    Показатели оценки модели: точность выборки, точность проверки, время прогнозирования.基于机器学习的订单簿高频交易策略Таблица 2 Эффект прогнозирования 1 тика с данными 1 тика

    基于机器学习的订单簿高频交易策略Таблица 3 прогнозирует эффект от тика 2 с данными 1 tick

    基于机器学习的订单簿高频交易策略Таблица 4 Эффект прогнозирования 2 tick с данными 2 tick

    Из данных трех таблиц выше мы можем сделать следующие выводы: Максимальная точность составляет примерно 70%, а если она достигает 60%, то она может быть преобразована в торговую стратегию.

    • #### (II) Стратегия имитации прибыли Например, 31 октября мы проводим симуляторную торговлю, и обычно в институте процентная ставка за торговлю фьючерсами на акции составляет 0.2610000Предположим, что количество сделок не ограничено, что цена на одну сделку составляет 0.2 пункта, а количество одиночных сделок - 1 руку.

    Таблица 5 Аналитические стратегии по состоянию на 31 октября基于机器学习的订单簿高频交易策略

    В течение дня было совершено 605 сделок, включая процедуры, было совершено 339 сделок с прибылью, выигрышный процент 56%, чистая прибыль 11814.99 юаней.

    Теоретическая цена сдвига составляет 14520 юаней, и эта часть является ключом к стратегическому боевому действию. Если подробности сдвига контролируются более тщательно, то можно уменьшить цену сдвига и увеличить чистую прибыль.

    Рисунок 7: Прибыль аналогичной стратегии на 31 октября基于机器学习的订单簿高频交易策略

Оригинальное заявление: Автор статьи, перевод с указанием источника.


Больше информации

Эван1987Ходвин учится изучать ордеры