Бэктестинг - это исследовательский процесс применения идеи торговой стратегии к историческим данным с целью установления прошлых результатов. В частности, бэктестинг не гарантирует будущих результатов стратегии.
В этой статье (и тех, которые последуют за ней) будет описана основная объектно-ориентированная система обратного тестирования, написанная в Python. Эта ранняя система будет в первую очередь "учебным пособием", используемым для демонстрации различных компонентов системы обратного тестирования. По мере прогресса в статьях будет добавляться более сложная функциональность.
Процесс разработки надежной системы обратного тестирования чрезвычайно сложен. Эффективное моделирование всех компонентов, влияющих на производительность алгоритмической торговой системы, является сложной задачей. Плохая гранулярность данных, непрозрачность маршрутизации ордеров у брокера, задержка ордеров и множество других факторов влияют на "истинную" производительность стратегии по сравнению с проверенной производительностью.
При разработке системы бэкстетинга очень хочется постоянно "переписывать ее с нуля", поскольку для оценки производительности имеет решающее значение больше факторов.
Учитывая эти проблемы, представленный здесь обратный тест будет несколько упрощенным. по мере изучения дальнейших вопросов (оптимизация портфеля, управление рисками, управление затратами на транзакции) обратный тест станет более надежным.
В целом существует два типа систем обратного тестирования, которые будут интересны. Первый основан на исследованиях, используется в основном на ранних стадиях, где будут проверены многие стратегии для выбора тех, для более серьезной оценки.
Второй тип системы обратного тестирования основан на событиях, то есть он выполняет процесс обратного тестирования в цикле исполнения, аналогичной (если не идентичной) самой системе исполнения торговли. Он будет реалистично моделировать данные рынка и процесс исполнения ордеров, чтобы обеспечить более строгую оценку стратегии.
Последние системы часто пишутся на высокопроизводительном языке, таком как C ++ или Java, где важна скорость выполнения.
Теперь будет обсуждаться проектирование и внедрение объектно-ориентированной исследовательской среды обратного тестирования.
На данном этапе бэкстестер разработан для простоты внедрения и разумной степени гибкости, в ущерб истинной точности рынка. В частности, этот бэкстестер сможет обрабатывать только стратегии, действующие на одном инструменте.
Как видно, этот бэкстестер не включает в себя никаких ссылок на управление портфелем / рисками, обработку исполнения (т.е. без лимитных ордеров), а также не будет предоставлять сложное моделирование затрат на транзакции. На данном этапе это не является большой проблемой. Он позволяет нам познакомиться с процессом создания объектно-ориентированного бэкстера и библиотеки Pandas / NumPy. Со временем он будет улучшен.
Теперь мы перейдем к описанию реализаций для каждого объекта.
На данном этапе объект Strategy должен быть довольно общим, поскольку он будет обрабатывать стратегии прогнозирования, среднего обратного движения, импульса и волатильности. Рассматриваемые здесь стратегии всегда будут основываться на временных рядах, т.е.
Класс Strategy также всегда будет производить рекомендации сигналов. Это означает, что он будет консультировать экземпляр портфеля в смысле длинного / короткого или удержания позиции. Эта гибкость позволит нам создать несколько Strategy
Интерфейс классов будет применяться с использованием методологии абстрактного базового класса. Абстрактный базовый класс - это объект, который не может быть инстанцирован, и, следовательно, могут быть созданы только производные классы. Код Python представлен ниже в файле под названием backtest.py. Класс Strategy требует, чтобы любой подкласс реализовал метод generate_signals.
Чтобы предотвратить непосредственное инстанцирование класса Strategy (поскольку он абстрактный!), необходимо использовать объекты ABCMeta и abstractmethod из модуля abc.метаклассчтобы быть равным ABCMeta, а затем украсить метод generate_signals с помощью декоратора abstractmethod.
# backtest.py
from abc import ABCMeta, abstractmethod
class Strategy(object):
"""Strategy is an abstract base class providing an interface for
all subsequent (inherited) trading strategies.
The goal of a (derived) Strategy object is to output a list of signals,
which has the form of a time series indexed pandas DataFrame.
In this instance only a single symbol/instrument is supported."""
__metaclass__ = ABCMeta
@abstractmethod
def generate_signals(self):
"""An implementation is required to return the DataFrame of symbols
containing the signals to go long, short or hold (1, -1 or 0)."""
raise NotImplementedError("Should implement generate_signals()!")
В то время как вышеуказанный интерфейс прост, он станет более сложным, когда этот класс будет унаследован для каждого конкретного типа стратегии.
На более позднем этапе эти задачи будут разбиты на отдельные компоненты. На данный момент они будут объединены в один класс.
Этот класс широко использует панды и дает отличный пример того, как библиотека может сэкономить огромное количество времени, особенно в отношении
Цель класса Portfolio заключается в том, чтобы в конечном итоге создать последовательность сделок и кривую акций, которые будут проанализированы классом Performance.
Класс портфеля должен знать, как распределять капитал для определенного набора торговых сигналов, как обрабатывать расходы на транзакции и какие формы ордеров будут использоваться. Объект Стратегии работает на панелях данных, и, следовательно, должны быть сделаны предположения относительно цен, достигнутых при исполнении ордера. Поскольку высокая/низкая цена любой панели неизвестна априори, для торговли можно использовать только цены открытия и закрытия. На самом деле невозможно гарантировать, что заказ будет выполнен по одной из этих конкретных цен при использовании рыночного ордера, поэтому это будет, в лучшем случае, приближение.
В дополнение к предположениям о выполнении заказов, этот бэктестер будет игнорировать все концепции ограничений маржи / брокерства и будет предполагать, что можно свободно идти длинным и коротким в любом инструменте без каких-либо ограничений ликвидности.
Следующий список продолжается на backtest.py:
# backtest.py
class Portfolio(object):
"""An abstract base class representing a portfolio of
positions (including both instruments and cash), determined
on the basis of a set of signals provided by a Strategy."""
__metaclass__ = ABCMeta
@abstractmethod
def generate_positions(self):
"""Provides the logic to determine how the portfolio
positions are allocated on the basis of forecasting
signals and available cash."""
raise NotImplementedError("Should implement generate_positions()!")
@abstractmethod
def backtest_portfolio(self):
"""Provides the logic to generate the trading orders
and subsequent equity curve (i.e. growth of total equity),
as a sum of holdings and cash, and the bar-period returns
associated with this curve based on the 'positions' DataFrame.
Produces a portfolio object that can be examined by
other classes/functions."""
raise NotImplementedError("Should implement backtest_portfolio()!")
На данном этапе были введены абстрактные базовые классы "Стратегия" и "Портфель".
Мы начнем с создания подкласса стратегии под названием RandomForecastStrategy, единственной задачей которого является создание случайным образом выбранных длинных/коротких сигналов! Хотя это явно бессмысленная торговая стратегия, она будет служить нашим потребностям, демонстрируя объектно-ориентированную структуру обратного тестирования. Таким образом, мы начнем новый файл под названием random_forecast.py, с перечнем случайного прогноза следующим образом:
# random_forecast.py
import numpy as np
import pandas as pd
import Quandl # Necessary for obtaining financial data easily
from backtest import Strategy, Portfolio
class RandomForecastingStrategy(Strategy):
"""Derives from Strategy to produce a set of signals that
are randomly generated long/shorts. Clearly a nonsensical
strategy, but perfectly acceptable for demonstrating the
backtesting infrastructure!"""
def __init__(self, symbol, bars):
"""Requires the symbol ticker and the pandas DataFrame of bars"""
self.symbol = symbol
self.bars = bars
def generate_signals(self):
"""Creates a pandas DataFrame of random signals."""
signals = pd.DataFrame(index=self.bars.index)
signals['signal'] = np.sign(np.random.randn(len(signals)))
# The first five elements are set to zero in order to minimise
# upstream NaN errors in the forecaster.
signals['signal'][0:5] = 0.0
return signals
Теперь, когда у нас есть
Объект портфеля, хотя и чрезвычайно гибкий в своем интерфейсе, требует конкретных выборов в отношении того, как обрабатывать затраты на транзакции, рыночные заказы и т. Д. В этом базовом примере я считаю, что будет возможно легко купить/сократить инструмент без ограничений или маржи, купить или продать непосредственно по открытой цене ствола, нулевые затраты на транзакции (включая скольжение, сборы и влияние на рынок) и указал количество запасов непосредственно покупать для каждой сделки.
Вот продолжение списка random_forecast.py:
# random_forecast.py
class MarketOnOpenPortfolio(Portfolio):
"""Inherits Portfolio to create a system that purchases 100 units of
a particular symbol upon a long/short signal, assuming the market
open price of a bar.
In addition, there are zero transaction costs and cash can be immediately
borrowed for shorting (no margin posting or interest requirements).
Requires:
symbol - A stock symbol which forms the basis of the portfolio.
bars - A DataFrame of bars for a symbol set.
signals - A pandas DataFrame of signals (1, 0, -1) for each symbol.
initial_capital - The amount in cash at the start of the portfolio."""
def __init__(self, symbol, bars, signals, initial_capital=100000.0):
self.symbol = symbol
self.bars = bars
self.signals = signals
self.initial_capital = float(initial_capital)
self.positions = self.generate_positions()
def generate_positions(self):
"""Creates a 'positions' DataFrame that simply longs or shorts
100 of the particular symbol based on the forecast signals of
{1, 0, -1} from the signals DataFrame."""
positions = pd.DataFrame(index=signals.index).fillna(0.0)
positions[self.symbol] = 100*signals['signal']
return positions
def backtest_portfolio(self):
"""Constructs a portfolio from the positions DataFrame by
assuming the ability to trade at the precise market open price
of each bar (an unrealistic assumption!).
Calculates the total of cash and the holdings (market price of
each position per bar), in order to generate an equity curve
('total') and a set of bar-based returns ('returns').
Returns the portfolio object to be used elsewhere."""
# Construct the portfolio DataFrame to use the same index
# as 'positions' and with a set of 'trading orders' in the
# 'pos_diff' object, assuming market open prices.
portfolio = self.positions*self.bars['Open']
pos_diff = self.positions.diff()
# Create the 'holdings' and 'cash' series by running through
# the trades and adding/subtracting the relevant quantity from
# each column
portfolio['holdings'] = (self.positions*self.bars['Open']).sum(axis=1)
portfolio['cash'] = self.initial_capital - (pos_diff*self.bars['Open']).sum(axis=1).cumsum()
# Finalise the total and bar-based returns based on the 'cash'
# and 'holdings' figures for the portfolio
portfolio['total'] = portfolio['cash'] + portfolio['holdings']
portfolio['returns'] = portfolio['total'].pct_change()
return portfolio
Это дает нам все, что нам нужно, чтобы создать кривую собственности на основе такой системы.главныйФункция:
if __name__ == "__main__":
# Obtain daily bars of SPY (ETF that generally
# follows the S&P500) from Quandl (requires 'pip install Quandl'
# on the command line)
symbol = 'SPY'
bars = Quandl.get("GOOG/NYSE_%s" % symbol, collapse="daily")
# Create a set of random forecasting signals for SPY
rfs = RandomForecastingStrategy(symbol, bars)
signals = rfs.generate_signals()
# Create a portfolio of SPY
portfolio = MarketOnOpenPortfolio(symbol, bars, signals, initial_capital=100000.0)
returns = portfolio.backtest_portfolio()
print returns.tail(10)
Выход программы выглядит следующим образом. Ваш будет отличаться от выхода ниже в зависимости от диапазона дат, который вы выберете, и используемого случайного семена:
SPY holdings cash total returns
Дата
2014-01-02 -18398 -18398 111486 93088 0.000097
2014-01-03 18321 18321 74844 93165 0.000827
2014-01-06 18347 18347 74844 93191 0.000279
2014-01-07 18309 18309 74844 93153 -0.000408
2014-01-08 -18345 -18345 111534 93189 0.000386
2014-01-09 -18410 -18410 111534 93124 -0.000698
2014-01-10 -18395 -18395 111534 93139 0.000161
2014-01-13 -18371 -18371 111534 93163 0.000258
2014-01-14 -18228 -18228 111534 93306 0.001535
2014-01-15 18410 18410 74714 93124 -0.001951
В этом случае стратегия потеряла деньги, что неудивительно, учитывая стохастическую природу прогнозирующего! Следующие шаги заключаются в создании объекта производительности, который принимает экземпляр портфеля и предоставляет список показателей производительности, на основе которых можно принять решение отфильтровать стратегию или нет.
Мы также можем улучшить объект портфеля, чтобы иметь более реалистичное управление затратами на транзакции (например, комиссионные и скольжение интерактивных брокеров). Мы также можем просто включить двигатель прогнозирования в объект Стратегии, который (надеюсь) принесет лучшие результаты. В следующих статьях мы рассмотрим эти концепции более подробно.