Произошедшее отклонение является одной из самых распространенных проблем, с которыми сталкиваются инвесторы, и многие знают о его существовании, но мало кто ценит его последствия. Мы склонны использовать только существующие компании при рецензировании, что означает, что мы исключаем последствия от компаний, которые вышли из рынка из-за банкротства, реструктуризации.
При корректировке исторических данных регулярно убираются некоторые неработающие, выбывшие из рынка, плохо работающие акции. Эти убираемые акции не появляются в вашем стратегическом фондовом пуле, то есть, когда рецензируется на прошлое, используется только информация о нынешних компонентных акциях, исключая влияние тех акций в компонентных акциях, которые будут убраны в будущем из-за плохих результатов или цен. На следующей диаграмме показано, что MSCI European Index Component Equities и т.д. ведут себя как портфель в прошлом.
Рисунок 1
Произошедшее отклонение является одной из самых распространенных проблем, с которыми сталкиваются инвесторы, и многие знают о его существовании, но мало кто ценит его последствия. Мы склонны использовать только существующие компании при рецензировании, что означает, что мы исключаем последствия от компаний, которые вышли из рынка из-за банкротства, реструктуризации.
При корректировке исторических данных регулярно убираются некоторые неработающие, выбывшие из рынка, плохо работающие акции. Эти убираемые акции не появляются в вашем стратегическом фондовом пуле, то есть, когда рецензируется на прошлое, используется только информация о нынешних компонентных акциях, исключая влияние тех акций в компонентных акциях, которые будут убраны в будущем из-за плохих результатов или цен. На следующей диаграмме показано, что MSCI European Index Component Equities и т.д. ведут себя как портфель в прошлом.
Рисунок 2
Это означает, что, когда мы используем резюме компаний, которые лучше всего работали за последние 30 лет, даже если некоторые из них имели высокий кредитный риск в то время, когда вы знаете, кто выживет, вы покупаете, когда у вас высокий кредитный риск или вы попали в затруднительное положение, и вы получаете очень высокую прибыль. Если учесть те акции, которые обанкротились, вышли на рынок или плохо работают, то вы получите прямо противоположный вывод: инвестиции в компании с высоким кредитным риском имеют гораздо меньшую долгосрочную прибыль, чем инвестиции в компании с хорошим кредитом.
И многие другие факторы приводят к противоположному результату при рассмотрении отклонений у выживших.
Рисунок 3
Рисунок 4
Одним из семи грехов рисунка является то, что мы не можем предсказать, какие компании выживут в прошлом и останутся составной частью индекса сегодня, тогда как провизорский уклон - это лишь один из примеров провизорского уклона. Провизорский уклон означает, что в рецензировании используются данные, которые не были доступны или не были публичными в то время, и это является наиболее распространенной ошибкой рецензирования.
Явным примером прогрессивного отклонения являются финансовые данные, в которых корректировка финансовых данных может привести к трудно обнаруживаемым ошибкам. Как правило, время публикации финансовых данных разных компаний отличается, и задержка часто наблюдается. В ретроспекции мы часто оцениваем финансовое состояние компании в зависимости от того, когда были опубликованы данные каждой компании.
Однако, когда точечные данные (PIT data) не доступны, задержка финансовых отчетов часто ошибочна. Ниже приведенная схема подтверждает различия между использованием PIT данных и не-PIT данных. В то же время, мы часто получаем корректированные конечные значения при загрузке исторических макроданных, но после выпуска данных ВВП многих развитых стран корректировка прибыли крупных компаний часто производится после двух корректировок.
Рисунок 5
Рисунок 6
Некоторые люди предпочитают рассказывать истории без каких-либо данных, а люди, которые занимаются количественным анализом, предпочитают рассказывать истории с данными и результатами.
Оглядываясь на две периоды 1997 - 2000 и 2000 - 2002 годов, мы можем прийти к противоположному выводу. С точки зрения американских акций в 1997 - 2000 годах, уровень прибыли был хорошим фактором, и результаты ретроспекции были очень убедительными. Однако, если вытянуть длительный интервал до 2002 года, мы обнаружим, что показатель прибыли больше не является хорошим фактором.
Рисунок 7
Однако, если посмотреть на рыночные показатели индекса Russell 3000, то мы можем сделать вывод, что показатель рентабельности по-прежнему является эффективным фактором, и, как видно, длительность выбора и повторного измерения фондового пула оказывает огромное влияние на эффективность оценки фактора.
Рисунок 8
На рынке каждый день обнаруживаются новые и положительные факторы, ищут вечный двигатель. Стратегии, которые могут быть выпущены, хорошо работают. Несмотря на то, что рассказчики интерпретируют историю очень увлекательно, их предсказания о будущем практически бесполезны. В финансовой экономике часто трудно понять взаимосвязь и причинность, поэтому лучше не быть рассказчиком, когда мы делаем результаты, которые противоречат общему смыслу или согласуются с первоначальным суждением.
Рисунок 9
В настоящее время данные, основанные на большом количестве данных и поддержанных компьютерами, часто надеются на недоступные коэффициенты благополучия. Однако первоначальные финансовые данные еще не достигли большого количества, и данные о сделках не удовлетворяют предпосылкам данных с низким уровнем шума.
Иногда добыча данных практически неэффективна. Например, мы смоделировали индекс S&P 500 с помощью двух различных алгоритмов с учетом фактора, и выбрали данные 2009-2014 годов для ретротеста. Результаты показали, что результаты ретротеста с использованием шести лучших показателей, используемых в 2009-2014 годах, были очень идеальными, в то время как результаты ретротеста с использованием исторической выборки данных были прямыми.
Диаграмма 10
Таким образом, мы все должны иметь четкую логику и мотивацию при разработке стратегии или поиске хороших факторов, а количественный анализ является инструментом для проверки собственной логики или мотивации, а не для поиска логических кратковременных путей. В целом, наши мотивы для разработки стратегии или поиска факторов связаны с фундаментальными теоретическими знаниями в области финансов, эффективности рынков, поведенческой финансовой науки и т. д. Конечно, мы не отрицаем ценности применения майнинга данных в области количественного анализа.
Рисунок 11
Сигнальный спад означает возможность предсказывать будущую долгосрочную доходность акций после появления одного фактора. В целом, высокий коэффициент замены и снижение сигнала связаны. Различные факторы выбора акций часто имеют разные характеристики информационного снижения. Более быстрый снижение сигнала часто требует более высокого коэффициента замены для получения прибыли. Однако более высокий коэффициент замены часто означает более высокие затраты на сделки. Добавление ограничения коэффициента замены в построении портфеля является относительно простым методом, но не идеальным, поскольку ограничения коэффициента замены иногда помогают нам блокировать прибыль, а иногда и наносят ущерб установленным показателям портфеля. Таким образом, взвешивание снижения сигнала замены, стоимости сделки и способности модели прогнозировать являются ключевыми для построения портфеля.
Итак, как определить оптимальную частоту корректировки? Нужно обратить внимание, что ограничения по заменным курсам не означают снижения частоты корректировки. Например, мы часто слышим подобные фразы. Мы - долгосрочные инвесторы, и мы ожидаем держать акции 3-5 лет. Поэтому мы корректируем их один раз в год.
Рисунок 12
Когда каждый день закрывается, мы покупаем самые худшие 100 акций, продаем предыдущие позиции, продолжаем ежедневную торговлю, с очень высоким уровнем доходности. Здесь также есть ошибка - отклонение от прогноза, пока не закрывается, мы не знаем, какие акции будут работать хуже в тот день, то есть использовать процедурную торговлю. Эта стратегия также неработает.
Рисунок 13
Традиционные методы контроля за значениями, в основном, включают в себя два вида винсоризации и трункции. Стандартизация данных также может рассматриваться как один из методов контроля за значениями, которые могут иметь значительное влияние на производительность модели. Например, в таблице ниже показаны уровни прибыли акций, составляющих корейский индекс S&P BMI.
Рисунок 14
Несмотря на то, что необычные значения могут содержать полезную информацию, в большинстве случаев они не содержат полезной информации. Конечно, это исключение для ценовых динамических факторов. Как показано на рисунке ниже, синяя линия представляет собой комбинированное представление после удаления необычных значений, а красная линия представляет собой исходные данные. Мы можем видеть, что динамическая стратегия исходных данных намного лучше, чем политика после удаления необычных значений.
Рисунок 15
Рисунок 16
В целом наиболее распространенной стратегией многофакторной стратегии является многопространственная стратегия, то есть много хороших акций и много плохих акций. К сожалению, не все факторы равны, а многопространственные характеристики несовместимы, а также возможные затраты и реальная целесообразность для количественных инвестиций. Ниже приведены многопространственные характеристики факторов, расположенные по размеру различий.
Рисунок 17
Ссылка: Прогулка по Уолл-стрит