За последние несколько лет мы изучили различные инструменты, которые помогли бы нам определить модели, которые можно использовать в ценах на активы.
В то время как все это отличные современные инструменты для анализа данных, подавляющее большинство моделей активов в отрасли по-прежнему использует статистический анализ временных рядов.
Во-первых, временный ряд определяется как некоторая величина, которая измеряется последовательно во времени в течение некоторого интервала.
В самой широкой форме анализ временных рядов заключается в том, чтобы сделать вывод о том, что произошло с рядом точек данных в прошлом и попытаться предсказать, что произойдет с ними в будущем.
Тем не менее, мы собираемся принять количественный статистический подход к временным рядам, предполагая, что наши временные ряды являются реализациями последовательностей случайных переменных. то есть, мы собираемся предположить, что существует какой-то основной генерирующий процесс для наших временных рядов на основе одного или нескольких статистических распределений, из которых эти переменные получены.
Анализ временных рядов пытается понять прошлое и предсказать будущее. Такая последовательность случайных переменных известна как стохастический процесс дискретного времени (DTSP).В количественной торговле мы пытаемся приспособить статистические модели к этим DTSP для вывода основных отношений между сериями или прогнозирования будущих значений для генерации торговых сигналов.
Временные ряды в целом, в том числе и вне финансового мира, часто содержат следующие особенности:
Наша цель как количественных исследователей - выявить тенденции, сезонные изменения и корреляции с использованием статистических методов временных рядов, и в конечном итоге генерировать торговые сигналы или фильтры на основе выводов или прогнозов.
Наш подход будет заключаться в следующем:
Кроме того, мы можем применять стандартные (классические/фреквентистские или байесовские) статистические тесты к нашим моделям временных рядов, чтобы оправдать определенное поведение, такое как изменение режима на рынках акций.
На сегодняшний день мы практически исключительно используем C ++ и Python для реализации нашей торговой стратегии. Оба этих языка являются "первоклассными средами" для написания целого торгового стека. Они оба содержат много библиотек и позволяют "конца к концу" строительство торговой системы исключительно в этом языке.
К сожалению, C++ и Python не обладают обширными статистическими библиотеками. Это один из их недостатков. По этой причине мы будем использовать статистическую среду R в качестве средства для проведения исследований временных рядов. R хорошо подходит для этой работы из-за наличия библиотек временных рядов, статистических методов и простых возможностей планирования.
К счастью, есть много чрезвычайно полезных учебных пособий по R, доступных в Интернете, и я укажу на них, когда мы пройдём по последовательности статей по анализу временных рядов.
Предыдущие статьи на темы статистического обучения, эконометрии и байесовского анализа были в основном вводными по характеру и не рассматривали применения таких методов к современной высокочастотной информации о ценах.
Для того, чтобы применить некоторые из вышеперечисленных методов к данным более высокой частоты, нам нужна математическая основа для объединения наших исследований.
В конечном итоге мы будем использовать байесовские инструменты и методы машинного обучения в сочетании с следующими методами, чтобы прогнозировать уровень и направление цен, действовать как фильтры и определять "изменение режима", то есть определить, когда наши временные ряды изменили свое основное статистическое поведение.
Наша дорожная карта временных рядов выглядит следующим образом. Каждая из нижеперечисленных тем будет формировать свою собственную статью или набор статей. Как только мы изучим эти методы подробно, мы сможем создать некоторые сложные современные модели для изучения высокочастотных данных.