Почему ФИДЕ все еще использует Эло?

11

Я был впечатлен тем, как работает система рейтинга Glicko . В частности:

  • больше игр, сыгранных в последнее время, приводит к стабилизации рейтинга
  • меньше игр, сыгранных в последнее время, приводят к колебаниям рейтинга, пока вы не получите несколько последних игр за пояс

USCF изменил свою систему так, чтобы она была похожей несколько лет назад (где есть скользящая шкала для усиления или ослабления изменения рейтинга для данного матча), и теперь, когда Glickman (изобретатель Glicko) находится в рейтинге для USCF, Я полагаю, что они в конечном итоге примут еще более гибкую систему, как и его собственная.

Есть ли причина (кроме того, что они сопротивляются изменениям, или они просто еще не дошли до этого), что ФИДЕ не принимает более точную рейтинговую систему?

Ева Фриман
источник

Ответы:

9

Не доказано, что Глико более точен. Глико просто решает проблему по-другому, с другим акцентом. Учтите, что все эти системы абстрагируют человеческий разум от четырехзначного числа.

В рейтингах много политики; это обидчивый предмет Если ФИДЕ примет его, они составят новый список из 100 лучших, и многие гроссмейстеры, вероятно, будут расстроены.

Система ELO очень проста для понимания; прозрачность важна. Более сложные системы имеют непосредственные недостатки.

Тони Эннис
источник
6
+1, хотя я не согласен с первым абзацем, в остальном это достаточно верно. 1) Доказано, что Glicko в среднем более точен (измеряется с точки зрения того, как часто он может предсказать, кто победит в данном матче). 2) Что касается абстрагирования человеческого разума от числа, это не совсем так. Это мера навыка, так что вы можете вычислить вероятности (для выигрыша / ничьей / проигрыша) при сравнении уровней умения. Это все подкреплено математикой и статистикой. В Glicko-2 есть даже новый фактор волатильности для тех игроков, которые играют непоследовательно (что позволяет их рейтингам колебаться больше).
Ева Фриман
1
Интересный. Тем не менее, я бы подтвердил, что «лучше в среднем» не обязательно «лучше». Что, если те времена, когда он не точен, причиняют реальный вред? Я пойду читать об этом, однако.
Тони Эннис
Это информативно. chess.com/article/view/chess-ratings---how-they-work
Тони Эннис
7

Насколько я понимаю, система рейтинга Glicko добавляет оценку надежности к рейтинговому числу, что может обеспечить более высокую справедливость в отношении расчетов корректировки оценочного рейтинга. Очевидно, это может привести к неверному предположению, что существует корреляция между игрой в рейтинговые игры и результирующей игровой силой (поскольку отсутствие игры снижает показатель надежности, что, в свою очередь, каким-то образом обесценивает ваш рейтинг). Я вижу много проблем, связанных с оценкой надежности, хотя должен признать, что я не специалист по тонкостям системы. Просто чтобы выбрать три:

  • Игрок, играющий только в редкую по рейтингу игру, может больше не получать приглашения. Представьте, что вы директор турнира и приглашаете привлекательных игроков. Теперь вам нужно выбирать между 10 игроками, каждый из которых имеет одинаковый рейтинг, но разные показатели надежности. Возможно, вы сначала выберете те, которые имеют лучшие показатели надежности. Со временем разрыв в надежности между игроками со многими рейтинговыми играми и меньшими может увеличиться.
  • Манипулирование рейтинговыми числами может стать проще. Даже система ELO небезопасна, потому что некоторые люди получают рейтинги или нормы IM / GM, играя в фальсифицированных турнирах. Хороший показатель надежности может сделать помощь игрокам без оценки надежности очень дешевой - хороший игрок дает рейтинговые очки, не теряя при этом много. Как только деньги вовлечены, безопасность чит-кода является важной проблемой. У меня такое ощущение, что рейтинговая система Glicko более подвержена манипуляциям.
  • Общение и понимание игровой силы может стать более трудным для масс. Когда вы сообщаете список рейтинга, вы сталкиваетесь с проблемами. Игрок с рейтингом 2000-50 имеет «реальную игровую силу» где-то между 1900 и 2100. У другого игрока есть 1950-2000, что означает число в диапазоне 1750 и 2150. Таким образом, игрок с 1950-2000 на самом деле может быть лучшим игроком, но, вероятно, будет ранжироваться ниже другого, только потому, что он играл меньше игр или против менее надежных противников. Вы делаете объяснение вашей системы рейтинга более трудным для людей, не гарантируя при этом большей справедливости. Мастер, который прекращает играть, может набрать «потенциальную силу» и похвастаться своим потенциалом чемпиона мира, потому что его число надежности создает все больше возможностей для отклонения (учтите:

Подводя итог: Вы могли бы получить больше, чем вы рассчитывали, потому что весь пакет не только приходят с улучшениями. И поскольку при взгляде на верхний предел рейтинговых списков возникают серьезные денежные проблемы, я не вижу преимуществ в изменении существующей системы.

луч
источник
Большинство рейтинговых списков имеют ограничение для оценки надежности (RD), а не пытаются использовать его для ранжирования игроков. Таким образом, 2000 (50) всегда будет оцениваться выше, чем 1950 (100). Согласно их текущему рейтингу, они имеют более высокий рейтинг, независимо от надежности. Если игрок 1950 (100) выиграет у 2000 (50), его рейтинг возрастет более значительно, чем в 1950 (50). Можете ли вы описать , как можно обмануть систему с Глико более подробно? Вы говорите о том, что ваш рейтинг мешков с песком, если у вас высокий RD?
Ева Freeman
@West Freeman: Я сомневаюсь , что это идеальное место , чтобы доказать относительную плутовку-подверженность рейтинговой системы , и я просто принимая догадки, потому что для меня это выглядит дешевле манипулировать систему, так как я не потеряется , что много рейтинговых очков себя, когда я намеренно проигрываю против игрока без рейтинга. Более важный момент моего ответа является то , что вы должны проверить систему не только для расчета справедливости, но обмануть-подверженность, communcatability и т.д., прежде чем выбросить рабочую систему.
Ray
Но как им искусственно повысить чей-то рейтинг? Обычно люди, пытающиеся играть в систему, пытаются понизить свой рейтинг, чтобы они могли играть в более низких секциях и выиграть первый приз. Это может быть проще с Glicko, если вы избегаете играть в течение длительного периода времени, а затем теряете несколько игр, которые вы должны были выиграть. Но в сочетании с рейтинговыми уровнями и тем фактом, что это может быть сделано только время от времени, потому что RD требуется время, чтобы вернуться наверх.
Ева Фриман
1
Вам могут понадобиться высокие рейтинги, чтобы получить титул, получить приглашения или получить оплату от клубов, чтобы играть за них или работать в качестве тренера. Я говорю о профессиональных шахматах здесь и о том, где реальные деньги, потому что вы подвергли сомнению поведение ФИДЕ.
Рэй