Могут ли алгоритмы машинного обучения предсказать спортивные результаты или результаты?

40

У меня есть множество наборов данных НФЛ, которые, я думаю, могли бы стать хорошим побочным проектом, но я пока ничего с ними не сделал.

Приход на этот сайт заставил меня задуматься об алгоритмах машинного обучения, и мне стало интересно, насколько они хороши в прогнозировании результатов футбольных игр или даже следующей игры.

Мне кажется, что можно было бы выявить некоторые тенденции - на 3-м и 1-м уровне команда с сильным откатом теоретически должна иметь тенденцию отбивать мяч в этой ситуации.

Подсчет очков может быть сложнее предсказать, но команда-победитель может быть.

Мой вопрос заключается в том, являются ли это хорошими вопросами для алгоритма машинного обучения. Может быть, тысячи людей уже пробовали это раньше, но природа спорта делает эту тему ненадежной.

Стив Каллестад
источник

Ответы:

18

Есть много хороших вопросов о футболе (и о спорте в целом), которые было бы здорово добавить в алгоритм и посмотреть, что получится. Самое сложное - это знать, что бросить в алгоритм.

Команда с хорошим RB может просто пропустить 3-й и короткий шорт только потому, что соперники, вероятно, ожидают бега, например. Таким образом, для того, чтобы действительно получить некоторые достойные результаты, я разбил бы проблему на более мелкие части и проанализировал бы их статистически, бросая их в машины.

Есть несколько (хороших) сайтов, которые пытаются сделать то же самое, вы должны проверить их и использовать все, что они нашли, чтобы помочь вам:

И если вы действительно хотите изучить анализ спортивных данных, вам обязательно нужно посмотреть видео со Sloan Sports Conference . Многие из них распространяются на Youtube.

lsdr
источник
13

Да. Почему бы нет?! Учитывая, что в каждом виде спорта в каждой игре записывается так много данных, разумное использование данных может помочь нам получить важную информацию о производительности игрока.

Некоторые примеры:

Итак, да, статистический анализ записей игроков может дать нам представление о том, какие игроки с большей вероятностью выступят, а какие нет . Таким образом, машинное обучение, близкий кузен статистического анализа, изменит правила игры.

Бинга
источник
9

Определенно они могут. Я могу нацелить вас на хорошую газету . Однажды я использовал его для реализации алгоритма прогнозирования результатов футбольной лиги, в первую очередь, чтобы иметь некоторую ценность против букмекеров.

Из реферата статьи:

Байесовская динамическая обобщенная модель для оценки зависящих от времени навыков всех команд в лиге и прогнозирования футбольных матчей на следующих выходных.

Ключевые слова:

Динамические Модели, Обобщенные Линейные Модели, Графические Модели, Методы Маркова Цепи Монте-Карло, Прогнозирование Футбольных Матчей

Образец цитирования:

Рю, Хавард и Ойвинд Сальвесен. «Прогноз и ретроспективный анализ футбольных матчей в лиге». Журнал Королевского статистического общества: Серия D (The Statistician) 49,3 (2000): 399-418.

IharS
источник
7

Машинное обучение и статистические методы могут улучшить прогноз, но никто не может предсказать реальный результат.

Несколько месяцев назад было соревнование по предсказанию турнира NCAA 2014 . Вы можете прочитать Конкурсный форум, чтобы получить лучшее представление о том, что люди делали и каких результатов они достигли.

Stanpol
источник
7

Ранее было показано, что методы машинного обучения могут применяться для прогнозирования спортивных результатов. Простой поиск в Google должен дать вам кучу результатов.

Тем не менее, было также показано (для НФЛ, кстати), что очень сложные прогностические модели, простые прогностические модели, опросы людей или знание толпы с использованием информации о ставках, все они выполняют более или менее одинаково. Источник: « Все становится очевидным, когда вы знаете ответ - Как здравый смысл терпит неудачу », глава 7, Дункан Уоттс.

iliasfl
источник
Интересный. Причина, по которой я задал вопрос, заключается в том, что я задавался вопросом, не похоже ли что-либо на «заблуждение игрока» (или даже на самого gf). Я думал, что может быть шанс, что это уже доказало, что это бесплодное предприятие. Тем не менее - эти другие ответы интригуют.
Стив Каллестад
6

Майкл Маубуссен в своей книге «Уравнение успеха» рассматривает различие между удачей и умением в различных начинаниях, в том числе в спорте. На самом деле он оценивает спорт по количеству удачи, которая способствует успехам в различных видах спорта (с. 23), и примерно 2/3 результатов в футболе связано с навыками. В отличие от этого, я использовал технику ММ для анализа производительности в гонках Формулы 1 и обнаружил, что 60% связано с навыками (меньше, чем я ожидал).

Тем не менее, кажется, что такого рода анализ будет означать, что достаточно подробный и специально разработанный набор функций позволит алгоритмам ML прогнозировать производительность команд НФЛ, возможно, даже до уровня игры, с оговоркой, что значительная разница все еще будет существовать из-за влияния удачи в игре.

user44202
источник
5

Я прочитал кое-что об этом, и я имел в виду следующий блог:

http://fellgernon.tumblr.com/post/46117939292/predicting-who-will-win-a-nfl-match-at-half-time#.UtehM7TWtQg

Этот блог имеет дело с предсказанием матча НФЛ после того, как перерыв закончился. Прогноз на 80% точен с простой моделью GLM.

Я не знаю, подходит ли это для футбола.

adesantos
источник
5

Я провел некоторые исследования в этой области. Я обнаружил, что цепочки Маркова первого порядка хорошо подходят для прогнозирования динамики игрового выигрыша в различных видах спорта.

Вы можете прочитать более подробно здесь: http://www.epjdatascience.com/content/3/1/4

merritts
источник
5

Они не могут предсказать, но они могут сказать вам наиболее вероятный результат. Там есть исследование об этом подходе от Этьена - Предсказание, кто выиграет Кубок мира с Wolfram Language . Это очень подробное исследование, поэтому вы можете проверить всю методологию, использованную для получения прогнозов.

Интересно, 11 из 15 матчей были верными!

Как и следовало ожидать, Бразилия является фаворитом, с вероятностью выиграть 42,5%. Этот поразительный результат объясняется тем, что Бразилия имеет самый высокий рейтинг Эло и играет дома.

(Поехали в Бразилию!)

mrtorture
источник
3

Многие люди подчеркивали, что можно предсказать в своих ответах. Теперь, увлекаясь глубоким обучением, вы можете, например, использовать RNN (скажем, LSTM) для прогнозирования результатов спортивных проблем, основанных на времени. Это современные и превосходящие традиционные модели руки вниз.

Баран
источник