Как я могу предсказать шансы на победу команды доджбола на основе истории побед своих игроков?

13

Представьте, что в мире есть 80 игроков в доджбол. Каждый из них играл в тысячи игр в доджбол с другими 79 игроками в более или менее случайном порядке. Это мир без команд (например, у каждого игрока есть шанс попасть в любую команду в каждой игре). Я знаю предыдущий коэффициент выигрыша каждого игрока (например, один выиграл 46% всех предыдущих игр, другой выиграл 56% всех своих предыдущих игр). Допустим, скоро будет матч, и я знаю, кто играет в каждой команде. Я также знаю их предыдущий коэффициент выигрыша.

Как лучше всего рассчитать вероятность победы каждой команды в зависимости от состава команды?

Если это требует относительно продвинутых вычислений (например, логистической регрессии), дайте мне знать некоторые особенности. Я довольно хорошо знаком с SPSS, но мне не нужно задавать дополнительный вопрос.

Кроме того, как я могу исследовать точность моего метода с использованием архивных данных? Я знаю, что это не будет четко, так как большинство игроков колеблются около 40-60%, но все же.

Чтобы быть конкретным, каковы шансы на победу команды А?

A - состоит из лиц с предыдущим коэффициентом выигрыша 52%, 54%, 56%, 58%, 60% B - состоит из лиц с предыдущим коэффициентом выигрыша 48%, 55%, 56%, 58%, 60%

(это просто случайный пример для иллюстративных целей. Две довольно хорошие команды.)

Изменить: Есть ли способ начать с очень простого алгоритма, а затем посмотреть, как он работает? Возможно, мы могли бы просто сложить проценты каждой команды и предсказать, что победит тот, у кого самый высокий процент. Конечно, наша классификация не будет точной, но по тысячам заархивированных игр мы могли видеть, можем ли мы предсказать лучше, чем шанс.

Behacad
источник
Разве это не простое деление средних? AvgTeam1WinP/ AvgTeam2WinP? Это должно дать шансы на team1победу team2.
PascalVKooten

Ответы:

2

Звучит как работа для наивного Байеса . Я не совсем понимаю теорию, лежащую в основе этого, поэтому, к сожалению, я не могу привести вам пример, но Байес работает с известными (архивными) данными, чтобы сделать выводы.

Я думаю, что Байес доступен только на Статистическом Сервере SPSS, поэтому, если у вас есть доступ к одному из них, вам повезло. В качестве альтернативы вы можете использовать Weka, который также включает в себя множество других классификаторов, так что, может быть, вы проведете свой эксперимент и сообщите нам о результатах?

AAВA

Рат
источник
Спасибо за ваш комментарий и за ваши изменения. Я подумал, что байесовский или машинный подход может быть лучшим. К сожалению, я относительно незнаком с этими подходами.
Behacad
2

Правильно ли, что у вас есть не только эти проценты, но и все результаты отдельных игр? Тогда я бы предложил r пакет PlayerRatings. Этот пакет не только решает проблемы, такие как подсчет силы игрока (используя алгоритмы, такие как elo или glicko), но также предлагает функции, которые могут предсказать будущие результаты игры.

Для примеров проверьте: http://cran.r-project.org/web/packages/PlayerRatings/vignettes/AFLRatings.pdf

rdatasculptor
источник
0

Разве это не простое деление средних? AvgTeam1WinP/ AvgTeam2WinP? Это должно дать шансы на team1победу team2.

Если я считаю следующее:

Если player1бы вы играли против player2в командах "1 человек", вы бы согласились, что вероятность того, что игрок 1 выиграет у игрока 2, будет равна вероятности того, что игрок 1 выиграет со случайным, деленная на вероятность того, что игрок 2 выиграет случайно (это, конечно, верно в случае, если вы считаете, что процент побед был точным, как в их асимптотическом пределе), просто:

OddsP1VsP2 = WinProbabilityP1 / WinProbabilityP2 

Если вы возразите, что некоторые игроки не испытывают эффекта взаимодействия, и они влияют на счет более негативно, чем ожидалось *, или если некоторые игроки действительно хорошо влияют на счет более позитивно, чем ожидалось **, то логично, что вы можете просто возьмите среднюю вероятность для каждого игрока в каждой команде.

* Если комбинация 60%, 60%, 60%, 60% считается лучше, чем команда из 70%, 70%, 70%, 30%, где один плохой игрок может привести к худшим шансам для команды, даже если средние значения одинаковы. Без дополнительных гипотез этот конкретный вопрос не может быть решен.

** Точно так же, если 50,50,50,90 не считается равным 60,60,60,60, то применяется то же самое.

PascalVKooten
источник