Представьте, что в мире есть 80 игроков в доджбол. Каждый из них играл в тысячи игр в доджбол с другими 79 игроками в более или менее случайном порядке. Это мир без команд (например, у каждого игрока есть шанс попасть в любую команду в каждой игре). Я знаю предыдущий коэффициент выигрыша каждого игрока (например, один выиграл 46% всех предыдущих игр, другой выиграл 56% всех своих предыдущих игр). Допустим, скоро будет матч, и я знаю, кто играет в каждой команде. Я также знаю их предыдущий коэффициент выигрыша.
Как лучше всего рассчитать вероятность победы каждой команды в зависимости от состава команды?
Если это требует относительно продвинутых вычислений (например, логистической регрессии), дайте мне знать некоторые особенности. Я довольно хорошо знаком с SPSS, но мне не нужно задавать дополнительный вопрос.
Кроме того, как я могу исследовать точность моего метода с использованием архивных данных? Я знаю, что это не будет четко, так как большинство игроков колеблются около 40-60%, но все же.
Чтобы быть конкретным, каковы шансы на победу команды А?
A - состоит из лиц с предыдущим коэффициентом выигрыша 52%, 54%, 56%, 58%, 60% B - состоит из лиц с предыдущим коэффициентом выигрыша 48%, 55%, 56%, 58%, 60%
(это просто случайный пример для иллюстративных целей. Две довольно хорошие команды.)
Изменить: Есть ли способ начать с очень простого алгоритма, а затем посмотреть, как он работает? Возможно, мы могли бы просто сложить проценты каждой команды и предсказать, что победит тот, у кого самый высокий процент. Конечно, наша классификация не будет точной, но по тысячам заархивированных игр мы могли видеть, можем ли мы предсказать лучше, чем шанс.
источник
AvgTeam1WinP
/AvgTeam2WinP
? Это должно дать шансы наteam1
победуteam2
.Ответы:
Звучит как работа для наивного Байеса . Я не совсем понимаю теорию, лежащую в основе этого, поэтому, к сожалению, я не могу привести вам пример, но Байес работает с известными (архивными) данными, чтобы сделать выводы.
Я думаю, что Байес доступен только на Статистическом Сервере SPSS, поэтому, если у вас есть доступ к одному из них, вам повезло. В качестве альтернативы вы можете использовать Weka, который также включает в себя множество других классификаторов, так что, может быть, вы проведете свой эксперимент и сообщите нам о результатах?
источник
Правильно ли, что у вас есть не только эти проценты, но и все результаты отдельных игр? Тогда я бы предложил r пакет PlayerRatings. Этот пакет не только решает проблемы, такие как подсчет силы игрока (используя алгоритмы, такие как elo или glicko), но также предлагает функции, которые могут предсказать будущие результаты игры.
Для примеров проверьте: http://cran.r-project.org/web/packages/PlayerRatings/vignettes/AFLRatings.pdf
источник
Разве это не простое деление средних?
AvgTeam1WinP
/AvgTeam2WinP
? Это должно дать шансы наteam1
победуteam2
.Если я считаю следующее:
Если
player1
бы вы играли противplayer2
в командах "1 человек", вы бы согласились, что вероятность того, что игрок 1 выиграет у игрока 2, будет равна вероятности того, что игрок 1 выиграет со случайным, деленная на вероятность того, что игрок 2 выиграет случайно (это, конечно, верно в случае, если вы считаете, что процент побед был точным, как в их асимптотическом пределе), просто:Если вы возразите, что некоторые игроки не испытывают эффекта взаимодействия, и они влияют на счет более негативно, чем ожидалось *, или если некоторые игроки действительно хорошо влияют на счет более позитивно, чем ожидалось **, то логично, что вы можете просто возьмите среднюю вероятность для каждого игрока в каждой команде.
* Если комбинация 60%, 60%, 60%, 60% считается лучше, чем команда из 70%, 70%, 70%, 30%, где один плохой игрок может привести к худшим шансам для команды, даже если средние значения одинаковы. Без дополнительных гипотез этот конкретный вопрос не может быть решен.
** Точно так же, если 50,50,50,90 не считается равным 60,60,60,60, то применяется то же самое.
источник