Измерение индивидуальной эффективности игрока в 2-х игроков на командные виды спорта

19

У меня есть таблица с результатами команд. Первая команда с 10 очками побеждает. В каждой команде 2 игрока. Игроки все время играют с разными товарищами по команде, хотя они выбраны не случайно. Индивидуальные оценки не сохраняются.

Таким образом, у нас Билл и Боб обыграли Энди и Алису со счетом 10-4, Джейк и Билл обыграли Джо и Джона со счетом 10-8

Можно ли придумать какой-то рейтинг для отдельных игроков, основываясь на всех доступных данных матчей. В основном, чтобы увидеть, сколько каждый игрок вносит в каждую игру с точки зрения очков или по отношению к другим игрокам?

Билл Уотерсон
источник
1
Если что-то из этого вообще полезно, и вам было бы интересно увидеть дальнейшее развитие простой адаптации модели «независимой оценки» к вашему сценарию, дайте мне знать, и я постараюсь написать это (надеюсь, немного больше кратко) как отдельный ответ. Приветствия.
кардинал

Ответы:

13

Ниже приведена пара очень простых моделей. Они оба имеют недостатки, по крайней мере, одним способом, но, возможно, они предоставят что-то, на чем можно было бы основываться. Вторая модель на самом деле не (вполне) учитывает сценарий ОП (см. Примечания ниже), но я оставляю его на случай, если он каким-то образом поможет.

Модель 1 : вариант модели Брэдли – Терри

Предположим, что мы в первую очередь заинтересованы в том, чтобы предсказать, победит ли одна команда другую, основываясь на игроках в каждой команде. Мы можем просто записать, побеждает ли команда 1 с игроками (i,j) команду 2 с игроками (k,) в каждой игре, игнорируя итоговый счет. Конечно, это выбрасывает некоторую информацию, но во многих случаях это все еще предоставляет много информации.

Модель , то

LограммяT(п(Команда 1 побеждает команду 2))знак равноαя+αJ-αК-α,

То есть у нас есть параметр «сродства» для каждого игрока, который влияет на то, насколько этот игрок повышает шансы на победу своей команды. Определите «силу» игрока по . Затем эта модель утверждает, что P ( команда 1 побеждает команду 2 ) = s i s jsязнак равноеαя

п(Команда 1 побеждает команду 2)знак равноsяsJsяsJ+sКs,

Здесь очень хорошая симметрия в том, что не имеет значения, как кодируется ответ, если он согласуется с предикторами. То есть мы также имеем

LограммяT(п(Команда 2 побеждает команду 1))знак равноαК+α-αя-αJ,

Это может быть легко приспособлено как логистическая регрессия с предикторами, которые являются индикаторами (по одному на каждого игрока), принимающими значение если игрок i входит в Команду 1 для рассматриваемой игры, - 1, если она в Команде 2, и 0, если она не участвовать в этой игре.+1я-10

Отсюда и естественный рейтинг игроков. Чем больше ( s ), тем больше игрок повышает шанс своей команды на победу. Таким образом, мы можем просто ранжировать игроков в соответствии с их оценочными коэффициентами. (Обратите внимание, что параметры сродства можно идентифицировать только с общим смещением. Поэтому обычно фиксируют α 1 = 0, чтобы сделать модель идентифицируемой.)αsα1знак равно0

Модель 2 : Независимая оценка

NB . После перечитывания вопроса ОП становится очевидным, что приведенные ниже модели не подходят для его настройки. В частности, ОП заинтересована в игре, которая заканчивается после того, как одна или другая команда набрали фиксированное количество очков. Приведенные ниже модели больше подходят для игр, которые имеют фиксированную продолжительность во времени. Модификации могут быть сделаны так, чтобы лучше соответствовать структуре ОП, но для их разработки потребуется отдельный ответ.

Теперь мы хотим отслеживать результаты. Предположим, что это разумное приближение, что каждая команда набирает очки независимо друг от друга с количеством очков, набранных в любом интервале, не зависящем от любого непересекающегося интервала. Затем количество очков, которое набирает каждая команда, можно смоделировать как случайную переменную Пуассона.

яJ

log(μ)=γi+γj

Обратите внимание, что эта модель игнорирует фактические совпадения между командами, ориентируясь исключительно на выигрыш.

σi=eγя(i,J)(К,)

п(Команда 1 побеждает команду 2 в внезапной смерти)знак равноσяσJσяσJ+σКσ,

ρяδя(я,J)(К,)

log(μ1)=ρi+ρjδkδ
log(μ2)знак равноρК+ρ-δя-δJ

В этой модели подсчет очков по-прежнему независим, но теперь между игроками в каждой команде происходит взаимодействие, которое влияет на счет. Игроки могут также быть оценены согласно их оценкам коэффициента сродства.

Модель 2 (и ее варианты) также позволяет прогнозировать окончательный результат.

Расширения . Одним из полезных способов расширения обеих моделей является включение порядка, в котором положительные показатели соответствуют «домашней» команде, а отрицательные показатели - «выездной» команде. Добавление термина «перехват» к моделям может быть интерпретировано как «преимущество домашнего поля». Другие расширения могут включать включение вероятности связей в Модель 1 (на самом деле это уже возможно в Модели 2).

Примечание : по крайней мере, один из компьютеризированных опросов ( Peter Wolfe's ), используемых для серии чемпионатов по боулингу в американском футболе среди колледжей, использует (стандартную) модель Брэдли – Терри для составления своего рейтинга.

кардинальный
источник
7

Алгоритм Microsoft TrueSkill , используемый для ранжирования игроков в XBox Live, может работать с командными матчами, но не учитывает границы победы. Это все еще может быть полезным для вас.

Мартин О'Лири
источник
1

Да.

Вы можете посмотреть на каждого игрока выигрыш / проигрыш и разницу очков. Я понимаю, что это простой ответ, но эта статистика все равно будет иметь смысл.

Адам
источник
Я хочу что-то более сложное, чем это. Похоже, что в среднем игрок вносит X очков в игру. Я хотел знать, смогу ли я понять это или грубое приближение как-то.
Билл Уотерсон
Я бы посмотрел, как Джефф Сагарин делает свои рейтинги силы для футбола колледжа и других видов спорта. Я предполагаю, что он охраняет свою формулу, но я думаю, что он сделал это, когда учился в магистратуре в Массачусетском технологическом институте. Сагарин учитывает, насколько вы бьете своих оппонентов, насколько хороши ваши оппоненты и сила графика (что может совпадать с тем, насколько хороши ваши оппоненты). Я думаю, что у парня по имени Дэнни Шеридан есть похожая система. Удачи.
Адам
1

(Я хотел бы добавить это в качестве комментария к предыдущему ответу, но моей репутации на данный момент недостаточно)

Мартин О'Лири связал TrueSkill алгоритм , и это хороший вариант. Если вы заинтересованы в использовании (больше, чем в разработке), попробуйте нашу ранговую систему ранжирования. Как и TrueSkill, он может управлять двумя фракциями с несколькими игроками в каждом (настольный теннис 2 на 2, настольный теннис 2 на 2, баскетбол 3 на 3 и 5 на 5 и более). Некоторые замечательные различия, среди прочего, заключаются в том, что ранг позволяет создавать более структурированные фракции (1-против-1, фракция против фракции, многопользовательская игра, мультифракция, совместные игры, асимметричные фракции и т. Д.) И является бесплатным для использования.

Вот сравнение между наиболее известными системами ранжирования.

Томазо Нери
источник