Рассмотрим эксперимент, который выводит отношение между 0 и 1. То, как это соотношение получается, не должно быть уместным в этом контексте. Он был разработан в предыдущей версии этого вопроса , но удален для ясности после обсуждения мета .
Этот эксперимент повторяется раз, пока мало (около 3-10). Предполагается, что независимы и одинаково распределены. Исходя из этого, мы оцениваем среднее значение путем вычисления среднего значения , но как рассчитать соответствующий доверительный интервал ?n X i ¯ X [ U , V ]
При использовании стандартного подхода для расчета доверительных интервалов иногда больше 1. Однако моя интуиция заключается в том, что правильный доверительный интервал ...
- ... должно быть в пределах 0 и 1
- ... должно уменьшаться с увеличением
- ... примерно в том порядке, который рассчитан с использованием стандартного подхода
- ... рассчитывается математически обоснованным методом
Это не абсолютные требования, но я хотел бы, по крайней мере, понять, почему моя интуиция ошибочна.
Расчеты на основе существующих ответов
Далее доверительные интервалы, полученные из существующих ответов, сравниваются для .
Стандартный подход (он же «Школа математики»)
, , таким образом, доверительный интервал 99% составляет . Это противоречит интуиции 1.
Обрезка (предложено @soakley в комментариях)
Простое использование стандартного подхода и предоставление качестве результата легко. Но мы можем сделать это? Я еще не уверен, что нижняя граница просто остается постоянной (-> 4.)
Модель логистической регрессии (предложено @Rose Hartman)
Преобразованные данные: результате его преобразование обратно приводит к . Очевидно, что 6,90 является выбросом для преобразованных данных, в то время как 0,99 не для нетрансформированных данных, что приводит к очень большому доверительному интервалу . (-> 3.)
Доверительный интервал биномиальной пропорции (предложено @Tim)
Подход выглядит неплохо, но, к сожалению, он не подходит для эксперимента. Простое объединение результатов и интерпретация их как одного большого повторного эксперимента Бернулли, как предлагает @ZahavaKor, приводит к следующему:
из в общей сложности. Подавая это в адж. Калькулятор Вальда дает . Это не кажется реалистичным, потому что ни один находится внутри этого интервала! (-> 3.)
Начальная загрузка (предложено @soakley)
При мы имеем 3125 возможных перестановок. Взяв среднего значения перестановок, мы получим . Видать не что плохо, хотя я бы ожидать больший интервал (-> 3). Тем не менее, для каждой конструкции он никогда не превышает . Таким образом, для небольшого образца он будет скорее расти, чем уменьшаться при увеличении (-> 2). Это, по крайней мере, то, что происходит с образцами, приведенными выше.
источник
Ответы:
Во-первых, чтобы уточнить, с чем вы имеете дело, это не совсем биномиальное распределение, как предполагает ваш вопрос (вы называете это экспериментом Бернулли). Биноминальное распределение дискретно - результат - либо успех, либо неудача. Ваш результат - это соотношение каждый раз, когда вы запускаете свой эксперимент , а не набор успехов и неудач, по которым вы затем рассчитываете одно суммарное соотношение. Из-за этого методы вычисления доверительного интервала биномиальной пропорции отбросят много вашей информации. И все же вы правы, что проблематично трактовать это так, как будто оно нормально распределено, поскольку вы можете получить КИ, который выходит за пределы возможного диапазона вашей переменной.
Я рекомендую думать об этом с точки зрения логистической регрессии. Запустите модель логистической регрессии с вашей переменной отношения в качестве результата и без предикторов. Перехват и его CI дадут вам то, что вам нужно в логитах, а затем вы сможете преобразовать его обратно в пропорции. Вы также можете просто выполнить логистическое преобразование самостоятельно, рассчитать КИ и затем преобразовать обратно в исходный масштаб. Мой питон ужасен, но вот как вы можете сделать это в R:
Вот нижняя и верхняя границы для 99% ДИ для этих данных:
источник
Возможно, вы захотите попробовать пересэмплирование / начальную загрузку. Давайте посмотрим на простой случай, который вы упомянули.
С 3 точками данных 0,99, 0,94 и 0,94 вы бы даже не делали повторную выборку, потому что вы можете просто перечислить все 27 возможных перестановок, найти среднее значение в каждом случае, а затем отсортировать средние значения.
Вопрос здесь: Как мы можем создать доверительный интервал для параметра теста перестановки? дает более подробную информацию, в том числе некоторый код R.
источник
Биномиальные доверительные интервалы были предметом дискуссий статистиков в течение длительного времени. Ваша проблема учитывает коэффициент менее 100%, но он становится еще более проблематичным, если мы используем 100%. Один проницательный способ задать вопрос:
Есть несколько методов для расчета этих хвостов. Я бы порекомендовал проверить математику в Википедии , или, если вы просто хотите получить ответ, поищите калькулятор биномиального интервала, подобный этому (который, как оказалось, также имеет некоторые дополнительные объяснения по математике).
источник
Байесовский подход:
источник