Какой алгоритм машинного обучения можно использовать для прогнозирования фондового рынка?

15

В качестве альтернативы можно прогнозировать валютные рынки. Я знаю, что это может быть довольно сложно, поэтому в качестве вступления я ищу простой алгоритм прогнозирования, который имеет некоторую точность.

(Это для магистерского проекта университета, который длится четыре месяца)

Я читал, что многослойная нейронная сеть может быть полезна. Есть мысли по этому поводу? Кроме того, семантический анализ социальных сетей может дать представление о поведении рынка, которое влияет на фондовый рынок. Тем не менее, семантический анализ в данный момент немного выходит за рамки проекта.

siamii
источник
15
Мой, но по понятным причинам я держу все это при себе!
babelproofreader
7
Если верить гипотезе эффективного рынка, невозможно последовательно достичь более высокой, чем в среднем, доходности рынка (без инсайдерских знаний), которая встроена в текущие ставки / цены. Многие люди не согласны с этим, но почти все согласны с тем, что это верно для случайного инвестора. Другими словами,
трехстрочная
5
Кажется маловероятным, что кто-либо захочет поделиться алгоритмом, который имеет какую - либо точность вне выборки. За исключением, возможно, некоторых опубликованных научных работ, где аномалия мала и не покрывает транзакционные издержки.
NPE
2
Для академической работы, возможно, более целесообразно смоделировать цены, чем пытаться их прогнозировать. Предсказание, вероятно, окажется неудачным, но моделирование может, по крайней мере, дать некоторое представление о том, как все работает на самом деле, и теоретически может быть распространено на предсказание.
highBandWidth
2
@wayne Я не думаю, что речь идет о переобучении, речь идет о разрешении предикторов, которые не могут быть использованы для прогнозов, например, переменных, которые возникают во время / после движения акций - если вы обнаружите, что акции Apple и Microsoft имеют тенденцию коррелировать, этот факт нельзя использовать предсказать запас MSFT, но может быть очень информативным.
rm999

Ответы:

17

Как упомянул babelproofreader , те, у кого есть успешный алгоритм, обычно очень скрытны. Таким образом, маловероятно, что какой-либо широко доступный алгоритм будет очень полезен из коробки, если вы не делаете с ним что-то умное (с этого момента он как бы перестает быть широко доступным, так как вы добавляете его).

При этом изучение моделей авторегрессионного целочисленного скользящего среднего (ARIMA) может быть полезным началом для прогнозирования данных временных рядов. Не ожидайте лучше, чем случайные результаты.

Майкл МакГоуэн
источник
5
+1: сколько раз я читал или посещал занятия и слышал людей, которые считают, что если у них будет достаточно сложный алгоритм, они могут разбогатеть на фондовых / электроэнергетических / товарных рынках. Вы пытаетесь объяснить переоснащение и т. Д., Но безрезультатно. Насколько я знаю, не будучи инсайдером, успешное программное обеспечение для биржевой торговли зависело от комиссий за транзакции, арбитража и высокой скорости. В настоящее время самым передовым является использование лазеек в правилах автоматической торговли и высокоскоростном предложении / отзыве заявок, чтобы нанести удар другим автоматическим трейдерам.
Уэйн
1
Другая проблема заключается в том, что несколько человек в конечном итоге используют один и тот же алгоритм, потому что они прошли обучение по одним и тем же данным, а затем провели объемные продажи / покупки. Можно ли ожидать, что какой-либо алгоритм будет иметь долгосрочную точность?
Мишель
@ Уэйн, есть стратегии для уменьшения переоснащения, хотя их трудно реализовать на данных временных рядов.
Зак
1
@ Зак: да, есть способы наказания за переоснащение, но я размышляю об этом отношении: ребята, которые выполнили некоторые базовые (возможно, ошибочные) подгонки кривой в Excel и считают, что могли бы заработать деньги с помощью своего секретного соуса , но то, что им действительно нужно, - это один из тех передовых, сложных алгоритмов, которые профессор просто не поделится с классом. Этот алгоритм будет соответствовать данным как перчатка, а затем предсказывать намного лучше, чем все другие спекулянты, использующие таблицы Excel ... но профессор продолжает размышлять о переобучении и ограничениях данных. Вздох.
Уэйн
12

Я думаю, что для ваших целей вы должны выбрать алгоритм машинного обучения, который вам интересен, и попробовать его.

Что касается теории эффективного рынка, рынки не являются эффективными в любом масштабе времени. Кроме того, некоторые люди (как в академических кругах, так и в реальной жизни) мотивированы интеллектуальным вызовом, а не просто быстро разбогатеть, и они публикуют интересные результаты (и я считаю неудавшийся результат интересным). Но относитесь ко всему, что вы читаете, с щепоткой соли; если результаты действительно хороши, возможно, их научный метод не так.

Data Mining With R может быть полезной книгой для вас; это дорого, так что попробуйте найти его в своей университетской библиотеке. Глава 2 рассказывает о том, что вы хотите сделать, и он получает лучшие результаты с помощью нейронной сети. Но имейте в виду, что он получает плохие результаты и тратит много процессорного времени на их получение. В обзорах Amazon говорится, что книга стоит на 20 долларов дороже, потому что в этой главе упоминается слово « финансы» ; при чтении у меня сложилось впечатление, что издатель заставил его написать это. Он сделал свою домашнюю работу, прочитал документы, просмотрел правильные списки рассылки, но его сердце не было в этом. Я получил некоторые полезные знания R, но не буду опережать рынок :-)

Даррен Кук
источник
@Darren - Мне нравится твой стиль.
rolando2
1
Черновую версию Data Mining с R (май 2003 г.) можно найти здесь . (У меня нет книги, поэтому я не могу сказать, в чем разница между двумя версиями.)
chl
@chi Спасибо! Я бросил быстрый взгляд, и там только две из четырех глав. Но большая разница в том, что глава « Прогнозирование доходности фондового рынка» сильно отличается. Никаких упоминаний о xts или quantmod и использовании пакета ts, а также использования acf и пакета MARS для прогнозов. Это почти как бонусная глава, и я собираюсь найти время, чтобы прочитать ее правильно. Он все еще использует нейронные сети, но не сравнивает их с SVM, как в опубликованной книге.
Даррен Кук
10

На мой взгляд, любой заурядный сильный ИИ, который мог бы выполнять все следующее, мог бы легко дать статистически значимый прогноз:

  • Собирать и понимать слухи

  • Доступ и интерпретация всех государственных знаний

  • Сделайте это в каждой соответствующей стране

  • Сделайте соответствующие прогнозы о:

    • Погодные условия

    • Террористическая деятельность

    • Мысли и чувства людей

    • Все остальное, что влияет на торговлю

Статистический анализ - это меньше всего твоих забот, правда.

Джон Перди
источник
4

Вы можете попробовать auto.arima и ETs функцию в R. Вы также может иметь некоторый успех с rugarch пакетом, но нет никаких существующих функций для автоматического выбора параметров. Может быть, вы могли бы получить параметры для средней модели auto.arima, а затем передать их rugarchи добавить garch(1,1)?

Там есть все виды блогов, которые требуют некоторого успеха в этом. Вот система, использующая модель arima (а затем модель garch) и система, использующая модель SVM . Вы найдете много полезной информации о торговле FOSS , особенно если вы начнете читать блоги в его блоге.

Какую бы модель вы ни использовали, обязательно проведите перекрестную проверку и сравнительный анализ! Я был бы очень удивлен, если бы вы нашли модель арима, ets или даже garch, которая могла бы постоянно превосходить наивную модель вне образца. Примеры перекрестной проверки временных рядов можно найти здесь и здесь . Имейте в виду, что вы ДЕЙСТВИТЕЛЬНО хотите прогнозировать прибыль, а не цены.

Zach
источник
2

Я знаю об одном подходе машинного обучения, который в настоящее время используется по крайней мере одним хедж-фондом. Numer.ai использует множество пользовательских алгоритмов машинного обучения для управления действиями фонда.

Другими словами: хедж-фонд предоставляет открытый доступ к зашифрованной версии данных на паре сотен инвестиционных инструментов, скорее всего, акций. Тысячи специалистов по обработке данных и тому подобное обучают все виды алгоритмов машинного обучения этим данным и загружают результаты в табло. Наивысшие баллы получают небольшую сумму денег в зависимости от точности их результатов и от того, как долго их результаты были доступны онлайн.

Лучшие прогнозы предположительно сделаны ансамблями алгоритмов.

Таким образом, у вас есть много ученых, предоставляющих подготовленные догадки, некоторые из которых сами являются ансамблями догадок, а хедж-фонд использует ансамбль всех предоставленных догадок для направления своих инвестиций.

Результаты этого довольно интересного хедж-фонда научили меня двум вещам:

  1. Ансамбли часто рассматриваются как хороший способ делать прогнозы на фондовом рынке.
  2. Хорошие прогнозы требуют больше ансамблей, чем я готов строить сам ...

Если вы хотите пойти, посетите: https://numer.ai/ Нет, я НЕ связан с ними, я бы, скорее всего, не проводил бы свои дни в Интернете, если бы я был подключен к хедж-фонду, в котором работают тысячи людей. Платят только те, которые дают ощутимые результаты :)

У сообщества numer.ai есть форум, на котором они обсуждают свой подход, поэтому вы МОЖЕТЕ учиться у других, которые пытаются сделать то же самое.

Лично я думаю, что любой с хорошим алгоритмом будет держать его в секрете.

Бейер
источник
1

Вы должны попробовать нейронные сети типа GMDH. Я знаю, что некоторые успешные коммерческие пакеты для прогнозирования фондового рынка используют его, но упоминают об этом только в глубине документации. В двух словах, это многослойная итеративная нейронная сеть, поэтому вы на правильном пути.

BrutForce
источник
0

Я думаю, что скрытые марковские модели популярны на фондовом рынке. Важно помнить, что вам нужен алгоритм, который сохраняет временную составляющую ваших данных.

Ророноа Зоро
источник