Мне задал следующий вопрос друг. Я не мог ей помочь, но я надеюсь, что кто-нибудь сможет мне это объяснить. Я не мог найти подобный пример. Спасибо за любую помощь и объяснение.
Q: Результаты 100 экспериментов с бросанием монет записываются как 0 = "Хвост" и 1 = "Голова". Выход x представляет собой строку из 0 и 1 длиной 100. И вычисляется количество раз, когда мы получаем 1-0-0 в x, и оно равно 20 (например, если x = (001001110100), 1-0-0 встречается 2 раза). Как вы думаете, это честная монета?
probability
inference
bernoulli-distribution
Джимми Дур
источник
источник
Ответы:
Решение проблемы с помощью симуляции
Моей первой попыткой было бы смоделировать это на компьютере, который может очень быстро перевернуть много монет. Ниже приведен пример с одним миллионом испытаний. Событие «то, что число разИкс когда шаблон« 1-0-0 »происходит при n = 100 монетных бросках, составляет 20 или более», происходит примерно раз в три тысячи испытаний, поэтому то, что вы наблюдали, не очень вероятно (для справедливого монета).
Обратите внимание, что гистограмма предназначена для моделирования, а линия - это точное вычисление, объясненное ниже.
Решение проблемы с точным вычислением
Для аналитического подхода вы можете использовать тот факт, что «вероятность наблюдать 20 или более последовательностей« 1-0-0 »за 100 бросков монеты равна 1 минус вероятность того, что для получения 20 последовательностей потребуется более 100 бросков». , Это решается в следующих шагах:
Время ожидания вероятности переключения «1-0-0»
Распределение,еN, Х = 1( н ) , количества раз, которое вам нужно перевернуть, пока вы не получите ровно одну последовательность '1-0-0', может быть вычислено следующим образом:
Давайте проанализируем способы получения «1-0-0» в виде цепочки Маркова. Мы следуем состояниям, описанным суффиксом строки переворотов: «1», «1-0» или «1-0-0». Например, если у вас есть следующие восемь сальто 10101100, то вы прошли по порядку следующие восемь состояний: «1», «1-0», «1», «1-0», «1», «1», «1-0», «1-0-0» и потребовалось восемь сальто, чтобы достичь «1-0-0». Обратите внимание , что вы не имеют равную вероятность достичь состояния «1-0-0» в каждом флип. Таким образом, вы не можете смоделировать это как биномиальное распределение . Вместо этого вы должны следовать дереву вероятностей. Состояние «1» может переходить в «1» и «1-0», состояние «1-0» может переходить в «1» и «1-0-0», и состояние «1-0-0» является поглощающим состоянием. Вы можете записать это как:
и вероятность достижения паттерна «1-0-0» после броска первого «1» (вы начинаете с состояния «0», еще не перевернув головы), в течениеN переворотов в полтора раза превышает вероятность быть в состоянии '1-0' в течение n - 1 сальто:
гдеFя - это я ое число Фибоначчи. Безусловная вероятность - это сумма
Время ожидания вероятности переворачиванияК раз '1-0-0'
Это вы можете вычислить путем свертки.
Вы получите вероятность наблюдать 20 или более паттернов «1-0-0» (основываясь на гипотезе, что монета справедлива)
Вот R-код для его вычисления:
Вычисление за нечестные монеты
Теперь мы используем обобщение чисел Фибоначчи:
вероятности теперь как:
а также
Когда мы строим это, вы получаете:
Таким образом, если вы думали перед экспериментом, что монета вряд ли несправедлива, то теперь вы все равно должны думать, что монета вряд ли несправедлива.
Можно было бы намного проще проверить вероятность получения справедливой монеты, подсчитав количество голов и хвостов и используя биномиальное распределение, чтобы смоделировать эти наблюдения и проверить, является ли наблюдение конкретным или нет.
Однако, возможно, монета подбрасывает в среднем одинаковое количество голов и хвостов, но это несправедливо в отношении определенных моделей. Например, у монеты может быть некоторая корреляция для последующих бросков монеты (я представляю какой-то механизм с полостями внутри металла монеты, которые заполнены песком, который будет течь как песочные часы к противоположному концу предыдущего броска монеты, который загружает монету падать скорее на ту же сторону, что и предыдущая сторона).
Использование математики в статистике
Выше все хорошо, но это не прямой ответ на вопрос
Чтобы ответить на этот вопрос, можно использовать вышеприведенную математику, но сначала нужно очень хорошо описать ситуацию, цели, определение справедливости и т. Д. Без какого-либо знания основ и обстоятельств любое вычисление будет просто математическим упражнением, а не ответом на явный вопрос.
Один открытый вопрос: почему и как мы ищем модель «1-0-0».
источник