Практические большие данные

Создано: 2018-01-26 12:11:58, Обновлено: 2019-07-31 18:03:38
comments   0
hits   1744

Большие данные в полевых условиях. Необходимость внештатных данных для тестирования количественной стратегии.

Практические большие данные

  • #### NO:01

Жизнь человека, от юности до зрелости, от зрелости до старости, на самом деле является непрерывным процессом совершения ошибок, исправления и совершения ошибок, и почти никто не может быть исключением. Возможно, было совершено много ошибок, которые сейчас кажутся очень низкими; или, возможно, было упущено много возможностей для посадки в машину, например: недвижимость, интернет, цифровая валюта и т. д. … независимо от того, был ли это пузырь, спросите вы, когда этот пузырь появился, вы не были там?

Мы слышали, как люди говорили: “Мне не следовало”… “Если бы я”…

Я держал этот вопрос в руках и долго не мог его отпустить, пока не понял, что это не то, чего стоит бояться, потому что каждый выбор, правильный или неправильный, отводит нас от заранее заданного результата к неизвестности, а наше размышление открывает нам божий взгляд за пределами исторических данных.

  • #### NO:02

Я видел множество торговых систем, которые при обратном измерении имеют более 50% успешности. При таком высоком успешном соотношении может быть более чем 1: 1 прибыль-убыток. Однако, без исключения, эти системы, как только они оказываются в реальном диапазоне, в основном теряют.

Практические большие данные

Однако, сделки - это такая запутанная вещь, что в ретроспективе все становится яснее, но если мы не вернемся к началу без Божьей перспективы, мы все равно не поймем, как это сделать. Это приводит к коренным проблемам количественного анализа и ограничениям исторических данных.

  • #### NO:03

Но как максимально использовать ограниченные данные для полноценной проверки торговой стратегии в условиях ограниченных данных? Обычно существуют два способа: экспрессионная проверка и перекрестная проверка.

Основные принципы рекурсивного тестирования: обучение модели с использованием более длинных исторических данных, а затем с использованием относительно коротких данных для проверки модели, а затем непрерывное перемещение окна сбора данных назад, повторяя шаги обучения и проверки.

Практические большие данные

1, данные по обучению: 2000-2001 гг., данные по тестированию: 2002 г.; 2, данные по обучению: 2001-2002 гг., данные по тестированию: 2003 г.; 3. данные о тренировках: 2002-2003 гг., данные о испытаниях: 2004 г.; 4. данные о тренировках: 2003-2004 гг., данные о испытаниях: 2005 г.; 5. данные о тренировках: 2004-2005 гг., данные о испытаниях: 2006 г.;

…и так далее…

Наконец, результаты тестирования (в 2002, 2003, 2004, 2005, 2006 гг.) были подсчитаны для комплексной оценки эффективности стратегии.

Принцип рекурсивного тестирования можно проиллюстрировать следующим образом:

Практические большие данные

На рисунке выше показаны два способа подакцизной проверки.

Первый тип: при каждом тестировании данные тестирования были более короткими, а количество тестирований - более большим. Второй тип: при каждом тестировании данные тестирования длиннее, а количество тестирований меньше.

В практическом применении можно проводить многократные испытания, изменяя длину тестовых данных, чтобы определить стабильность модели в отношении неравномерных данных.

  • #### NO:04

Основные принципы перекрестной проверки: разделите все данные на N частей, используйте N-1 частей для тренировки и оставшуюся часть для проверки.

Практические большие данные

Если разделить 2000-2003 гг. на четыре части, то процесс перекрестной проверки будет выглядеть следующим образом: 1, данные о тренировках: 2001-2003, данные о тестировании: 2000; 2) Данные о тренировках: 2000-2002, данные о испытаниях: 2003 3. Данные о тренировках: 2000, 2001, 2003, данные о испытаниях: 2002; 4. Данные о подготовке: 2000, 2002, 2003, данные о тестировании: 2001;

Практические большие данные

Как показано на рисунке выше: наибольшим преимуществом кросс-тестирования является полное использование ограниченных данных, каждый тренировочный данный также является тестовым данным. Однако при применении кросс-тестирования к проверке стратегических моделей существуют и явные недостатки:

  1. Когда данные о ценах неустойчивы, результаты тестирования моделей часто ненадёжны. Например, используйте данные 2008 года для тренировки и тестируйте данные 2005 года. Вполне вероятно, что рыночная ситуация в 2008 году сильно изменилась по сравнению с 2005 годом, поэтому результаты тестирования моделей ненадёжны.

  2. Как и в первом случае, в перекрестной проверке, если использовать новейшую модель обучения данным, а старую модель тестирования данными, это само по себе не очень логично.

  • #### NO:05

Кроме того, при проверке параметрической модели стратегии, как в рецессивной проверке, так и в перекрестной проверке, возникают проблемы с перекрытием данных.

Практические большие данные

При разработке моделей стратегии торговли большинство технических показателей основаны на исторических данных определенной длины. Например, используя трендовые показатели, вычислить исторические данные за последние 50 дней, а на следующий торговый день, показатель, который вычислил данные за 50 дней до этого дня торговли, тогда вычислить данные этих двух показателей на 49 дней одинаковы, что приведет к незначительному изменению показателя каждые два соседних дня.

Практические большие данные

Переплетение данных может привести к следующим последствиям:

  1. Медленное изменение результатов, предсказанных моделью, приводит к медленному изменению позиций, что мы называем задержкой показателя.

  2. Некоторые статистические значения не используются для проверки результатов модели, что делает результаты некоторых статистических проверок ненадежными из-за последовательности, вызванной дублированием данных.

  • #### NO:06

Хорошие торговые стратегии должны быть прибыльными в будущем. Внештатное тестирование, помимо объективного обнаружения торговых стратегий, более эффективно экономит время гостей.

В большинстве случаев, используя оптимальные параметры для всех образцов, вводить их в боевые действия очень опасно.

Если разделить все исторические данные до момента проведения параметрической оптимизации на данные внутри выборки и данные вне выборки, сначала использовать данные внутри выборки для параметрической оптимизации, а затем использовать данные вне выборки для вне выборки, можно выявить эту ошибку, а также проверить, применимы ли стратегии после оптимизации к будущим рынкам.

  • #### NO:07

Как и в случае с торговлей, мы никогда не сможем пересечь время и принять правильное решение, не совершив ни малейшей ошибки. Если бы существовала Божья рука или способность пересечь будущее, то можно было бы без испытаний, прямо в сети, торговать на реальных биржах, и получить кувшин с бонусами. А я, как и все простые люди, должен проверить наши стратегии в исторических данных.

Однако, даже имея огромную историю данных, история крайне скудна перед лицом бесконечного и непредсказуемого будущего. Таким образом, торговая система, основанная на истории, которая выдвигается вверх и вниз, в конечном итоге погружается со временем.

Практические большие данные

  • #### NO:08

Мы (изобретатели квантовой торговой платформы квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой квантовой кванто

Практические большие данные

Делиться - это умение, а не только умение!

Онлайн-помощник Автор: Hukybo