Как я могу проверить справедливость двадцатигранного кубика (d20)? Очевидно, я бы сравнил распределение значений с равномерным распределением. Я смутно помню использование теста хи-квадрат в колледже. Как я могу применить это, чтобы увидеть, честен ли кубик?
hypothesis-testing
chi-squared
goodness-of-fit
uniform
dice
Пересекать
источник
источник
Ответы:
Вот пример с кодом R Выводу предшествует #. Честная смерть
Смещенный кубик - числа от 1 до 10 имеют вероятность 0,045; эти 11-20 имеют вероятность 0,055 - 200 бросков:
У нас недостаточно доказательств смещения (р = 0,64).
Предвзятый кубик, 1000 бросков:
Теперь р <0,05, и мы начинаем видеть признаки смещения. Вы можете использовать подобное моделирование для оценки уровня смещения, которое вы можете ожидать, и количества бросков, необходимых для его обнаружения с заданным p-уровнем.
Ничего себе, еще 2 ответа, прежде чем я закончил печатать.
источник
Вы хотите сделать это вручную или в Excel?
Если вы хотите сделать это в R , вы можете сделать это следующим образом:
Шаг 1: бросьте кубик (скажем) 100 раз.
Шаг 2: посчитайте, сколько раз вы получили каждый из ваших номеров
Шаг 3: поместите их в R следующим образом (напишите число раз, когда вы получили бросок кубика вместо чисел, которые я написал):
Шаг 4: просто запустите эту команду:
Если значение P низкое (например: ниже 0,05) - ваш кубик не сбалансирован.
Эта команда имитирует симметричный кристалл (P = ~ .5):
И это симулирует неуравновешенный кубик:
(Это должно быть около P = ~ .005)
Теперь реальный вопрос заключается в том, сколько кубиков нужно бросить на какой уровень мощности обнаружения. Если кто-то хочет заняться этим, его приветствуют ...
Обновление: Существует также хорошая статья на эту тему здесь .
источник
Во-первых, в соответствии с тем, что сказал @Glen_b, байесианец на самом деле не интересуется, действительно ли кубик абсолютно честен - это не так. Что его волнует, так это то, достаточно ли он близок , что бы ни означало «достаточно» в контексте, скажем, в пределах 5% от справедливости для каждой стороны.
Во всяком случае, вот как (с R):
Во-первых, получить некоторые данные. Мы бросаем кубик 500 раз.
(мы начинаем с честного кубика; на практике эти данные будут соблюдаться.)
Наконец, давайте оценим нашу апостериорную вероятность (после наблюдения данных), что матрица находится в пределах 0,05 от справедливой по каждой координате.
Результат около 0,9486 на моей машине. (Не удивительно, правда. Мы все-таки начали с честного кубика.)
Быстрое замечание: для нас, вероятно, не имеет смысла использовать неинформативный ранее в этом примере. Поскольку существует даже вопрос, предположительно, что матрица вначале выглядит приблизительно сбалансированной, поэтому может быть лучше выбрать априор, сконцентрированный ближе к 1/3 во всех координатах. Выше это просто сделало бы нашу предполагаемую апостериорную вероятность «близкой к справедливой» еще выше.
источник
Тест на соответствие критерию хи-квадрат направлен на то, чтобы найти все возможные отклонения от строгой однородности. Это разумно с d4 или d6, но с d20 вы, вероятно, больше заинтересованы в проверке того, что вероятность того, что вы выберете (или, возможно, превысите) каждый результат, близка к той, которая должна быть.
Я имею в виду, что есть некоторые виды отклонений от справедливости, которые будут сильно влиять на то, для чего вы используете d20, и другие виды отклонений, которые вряд ли имеют значение вообще, и критерий хи-квадрат разделит власть между более интересными и менее интересные альтернативы. Следствием этого является то, что для того, чтобы иметь достаточно силы, чтобы уловить даже довольно умеренные отклонения от справедливости, вам нужно огромное количество бросков - гораздо больше, чем вы когда-либо хотели бы сидеть и генерировать.
(Подсказка: придумайте несколько наборов неоднородных вероятностей для вашего d20, которые будут наиболее сильно влиять на результат, для которого вы используете d20, и используйте симуляции и тесты хи-квадрат, чтобы выяснить, какую силу вы им противостоите различное количество рулонов, так что вы получите представление о количестве рулонов, которые вам понадобятся.)
Существуют различные способы проверки «интересных» отклонений (те, которые с большей вероятностью окажут существенное влияние на типичное использование d20)
Моя рекомендация состоит в том, чтобы сделать тест ECDF (тест типа Колмогорова-Смирнова / Андерсона-Дарлинга - но вы, вероятно, захотите отрегулировать консервативность, обусловленную дискретностью распределения - по крайней мере, подняв номинальный альфа-уровень, но даже лучше, просто симулируя распределение, чтобы увидеть, как распределение тестовой статистики идет для d20).
Они по-прежнему могут улавливать любые отклонения, но придают относительно больший вес более важным видам отклонений.
Еще более эффективный подход состоит в том, чтобы специально построить статистику теста, которая особенно чувствительна к наиболее важным для вас альтернативам, но требует немного больше работы.
В этом ответе я предлагаю графический метод тестирования матрицы, основанный на размерах отдельных отклонений. Как и в тесте хи-квадрат, это больше подходит для игры в кости с несколькими сторонами, такими как d4 или d6.
источник
Если вас интересует просто проверка количества раз, когда появляется каждое число, тогда подойдет критерий хи-квадрат. Предположим, вы бросили кубик N раз. Можно ожидать, что каждое значение возрастет N / 20 раз. Все, что делает тест хи-квадрат, это сравнивает то, что вы наблюдали, с тем, что вы получаете. Если эта разница слишком велика, это указывает на проблему.
Другие тесты
Если вас интересовали другие аспекты случайности, например, если вы играли в кости, выдали следующее:
Тогда, хотя этот вывод имеет правильное число каждого отдельного значения, он явно не случайный. В этом случае взгляните на этот вопрос . Это, вероятно, имеет смысл только для электронных кубиков.
Тест хи-квадрат в R
В R это будет
источник
Возможно, не следует концентрироваться на одном наборе ролей.
Попробуйте бросить шестигранный кубик 10 раз и повторите процесс 8 раз.
Вы можете проверить, что сумма для каждой повторной суммы равна 10.
Для каждого повтора (по столбцам) вы можете рассчитать степень соответствия, используя критерий Chi ^ 2.
Чем больше бросков вы сделаете, тем меньше предвзятости вы увидите. Давайте сделаем это для большого количества.
источник