Почему ФИДЕ все еще использует Эло?

Не доказано, что Глико более точен. Глико просто решает проблему по-другому, с другим акцентом. Учтите, что все эти системы абстрагируют человеческий разум от четырехзначного числа.

В рейтингах много политики; это обидчивый предмет Если ФИДЕ примет его, они составят новый список из 100 лучших, и многие гроссмейстеры, вероятно, будут расстроены.

Система ELO очень проста для понимания; прозрачность важна. Более сложные системы имеют непосредственные недостатки.

Тони Эннис
источник

+1, хотя я не согласен с первым абзацем, в остальном это достаточно верно. 1) Доказано, что Glicko в среднем более точен (измеряется с точки зрения того, как часто он может предсказать, кто победит в данном матче). 2) Что касается абстрагирования человеческого разума от числа, это не совсем так. Это мера навыка, так что вы можете вычислить вероятности (для выигрыша / ничьей / проигрыша) при сравнении уровней умения. Это все подкреплено математикой и статистикой. В Glicko-2 есть даже новый фактор волатильности для тех игроков, которые играют непоследовательно (что позволяет их рейтингам колебаться больше).

Ева Фриман

Интересный. Тем не менее, я бы подтвердил, что «лучше в среднем» не обязательно «лучше». Что, если те времена, когда он не точен, причиняют реальный вред? Я пойду читать об этом, однако.

Тони Эннис

ru.wikipedia.org/wiki/Glicko_rating_system

Тони Эннис,

Это информативно. chess.com/article/view/chess-ratings---how-they-work

Тони Эннис

Насколько я понимаю, система рейтинга Glicko добавляет оценку надежности к рейтинговому числу, что может обеспечить более высокую справедливость в отношении расчетов корректировки оценочного рейтинга. Очевидно, это может привести к неверному предположению, что существует корреляция между игрой в рейтинговые игры и результирующей игровой силой (поскольку отсутствие игры снижает показатель надежности, что, в свою очередь, каким-то образом обесценивает ваш рейтинг). Я вижу много проблем, связанных с оценкой надежности, хотя должен признать, что я не специалист по тонкостям системы. Просто чтобы выбрать три:

Игрок, играющий только в редкую по рейтингу игру, может больше не получать приглашения. Представьте, что вы директор турнира и приглашаете привлекательных игроков. Теперь вам нужно выбирать между 10 игроками, каждый из которых имеет одинаковый рейтинг, но разные показатели надежности. Возможно, вы сначала выберете те, которые имеют лучшие показатели надежности. Со временем разрыв в надежности между игроками со многими рейтинговыми играми и меньшими может увеличиться.
Манипулирование рейтинговыми числами может стать проще. Даже система ELO небезопасна, потому что некоторые люди получают рейтинги или нормы IM / GM, играя в фальсифицированных турнирах. Хороший показатель надежности может сделать помощь игрокам без оценки надежности очень дешевой - хороший игрок дает рейтинговые очки, не теряя при этом много. Как только деньги вовлечены, безопасность чит-кода является важной проблемой. У меня такое ощущение, что рейтинговая система Glicko более подвержена манипуляциям.
Общение и понимание игровой силы может стать более трудным для масс. Когда вы сообщаете список рейтинга, вы сталкиваетесь с проблемами. Игрок с рейтингом 2000-50 имеет «реальную игровую силу» где-то между 1900 и 2100. У другого игрока есть 1950-2000, что означает число в диапазоне 1750 и 2150. Таким образом, игрок с 1950-2000 на самом деле может быть лучшим игроком, но, вероятно, будет ранжироваться ниже другого, только потому, что он играл меньше игр или против менее надежных противников. Вы делаете объяснение вашей системы рейтинга более трудным для людей, не гарантируя при этом большей справедливости. Мастер, который прекращает играть, может набрать «потенциальную силу» и похвастаться своим потенциалом чемпиона мира, потому что его число надежности создает все больше возможностей для отклонения (учтите:

Подводя итог: Вы могли бы получить больше, чем вы рассчитывали, потому что весь пакет не только приходят с улучшениями. И поскольку при взгляде на верхний предел рейтинговых списков возникают серьезные денежные проблемы, я не вижу преимуществ в изменении существующей системы.

луч
источник

Большинство рейтинговых списков имеют ограничение для оценки надежности (RD), а не пытаются использовать его для ранжирования игроков. Таким образом, 2000 (50) всегда будет оцениваться выше, чем 1950 (100). Согласно их текущему рейтингу, они имеют более высокий рейтинг, независимо от надежности. Если игрок 1950 (100) выиграет у 2000 (50), его рейтинг возрастет более значительно, чем в 1950 (50). Можете ли вы описать , как можно обмануть систему с Глико более подробно? Вы говорите о том, что ваш рейтинг мешков с песком, если у вас высокий RD?

Ева Freeman

@West Freeman: Я сомневаюсь , что это идеальное место , чтобы доказать относительную плутовку-подверженность рейтинговой системы , и я просто принимая догадки, потому что для меня это выглядит дешевле манипулировать систему, так как я не потеряется , что много рейтинговых очков себя, когда я намеренно проигрываю против игрока без рейтинга. Более важный момент моего ответа является то , что вы должны проверить систему не только для расчета справедливости, но обмануть-подверженность, communcatability и т.д., прежде чем выбросить рабочую систему.

Ray

Но как им искусственно повысить чей-то рейтинг? Обычно люди, пытающиеся играть в систему, пытаются понизить свой рейтинг, чтобы они могли играть в более низких секциях и выиграть первый приз. Это может быть проще с Glicko, если вы избегаете играть в течение длительного периода времени, а затем теряете несколько игр, которые вы должны были выиграть. Но в сочетании с рейтинговыми уровнями и тем фактом, что это может быть сделано только время от времени, потому что RD требуется время, чтобы вернуться наверх.

Ева Фриман

Вам могут понадобиться высокие рейтинги, чтобы получить титул, получить приглашения или получить оплату от клубов, чтобы играть за них или работать в качестве тренера. Я говорю о профессиональных шахматах здесь и о том, где реальные деньги, потому что вы подвергли сомнению поведение ФИДЕ.

Рэй

Почему ФИДЕ все еще использует Эло?

Ответы: