(Заранее извиняюсь за использование языка мирян, а не статистического языка.)
Если я хочу измерить шансы накатывания каждой стороны конкретного физического шестигранного кристалла с точностью примерно +/- 2% с достаточной уверенностью в достоверности, сколько потребуется образцовых роликов?
т.е. сколько раз мне нужно было бы бросить кубик, считая каждый результат, чтобы быть на 98% уверенным, что шансы на то, что он бросит каждую сторону, находятся в пределах 14,6% - 18,7%? (Или некоторые аналогичные критерии, при которых можно было бы убедиться на 98%, что умирание справедливо с точностью до 2%.)
(Это реальная проблема для игр-симуляторов, в которых используются кости, и они хотят убедиться, что определенные конструкции костей приемлемо близки к 1/6 вероятности броска каждого числа. Есть утверждения, что многие обычные конструкции костей были измерены, бросая 29% 1 к бросать несколько таких кубиков по 1000 раз каждый.)
источник
Ответы:
TL; DR: еслиp = 1/6, и вы хотите знать, насколько велико n должно быть на 98%, чтобы убедиться, что игра в кости справедлива (с точностью до 2%), n должно быть не менее n ≥ 766 .
Пустьn будет числом рулонов, а X - количеством рулонов, которые приземляются на определенной стороне. Тогда X следует биномиальному (n, p) распределению, где p - вероятность получения указанной стороны.
По центральной предельной теореме мы знаем, что
посколькуX/n - это выборочное среднееn случайных величинБернулли(p) . Следовательно, для большихn доверительные интервалы дляp могут быть построены как
Так какp неизвестно, мы можем заменить его среднюю выборочную р = Х / п , и различными теоремами сходимости, мы знаем , что в результате доверительный интервал будет асимптотический действительным. Таким образом, мы получаем доверительные интервалы видаp^=X/n
с р = Х / п . Я предполагаю, что вы знаете, что такое Z- баллы. Например, если вы хотите 95% доверительный интервал, вы принимаете Z = 1,96 . Таким образом, для данного уровня достоверности α мы имеемp^=X/n Z Z=1.96 α
Теперь предположим, что вы хотите, чтобы этот доверительный интервал имел длину меньше, чемCα , и хотите знать, насколько большой выборки нам нужен для этого случая. Ну, это равносильно тому, чтобы спросить, что удовлетворяет nα
Который затем решается получить
Таким образом , вилка в ваших значенийZα ; , Cα ; , и по оценкам р , чтобы получить оценку для п & alpha ;p^ nα . Обратите внимание, что, поскольку p неизвестно, это только оценка, но асимптотически (при увеличении n ) она должна быть точной.
источник