У меня есть три группы данных, каждая с биномиальным распределением (то есть каждая группа имеет элементы, которые являются либо успехом, либо неудачей). У меня нет прогнозируемой вероятности успеха, но вместо этого я могу полагаться только на показатель успешности каждого из них в качестве приблизительного значения для истинного уровня успеха. Я нашел только этот вопрос , который близок, но, похоже, не совсем подходит к этому сценарию.
Чтобы упростить тест, давайте просто скажем, что у меня есть 2 группы (3 могут быть расширены из этого базового случая).
- Испытания группы 1: = 2455
- Испытания группы 2: = 2730
- Успех группы 1: = 1556
- Успех группы 2: = 1671
У меня нет ожидаемой вероятности успеха, только то, что я знаю из образцов. Итак, мой предполагаемый уровень успеха для двух групп:
- Успех группы 1: = 1556/2455 = 63,4%
- Успех группы 2: = 1671/2730 = 61,2%
Показатель успешности каждого образца довольно близок. Однако мои размеры выборки также довольно велики. Если я проверяю CDF биномиального распределения, чтобы увидеть, насколько он отличается от первого (где я предполагаю, что первый - нулевой тест), я получаю очень небольшую вероятность того, что второе может быть достигнуто.
В Excel:
1-BINOM.DIST (1556 245,61,2%, ИСТИНА) = 0,012
Однако это не учитывает дисперсию первого результата, оно просто предполагает, что первый результат является вероятностью теста.
Есть ли лучший способ проверить, действительно ли эти две выборки данных статистически отличаются друг от друга?
prop.test
:prop.test(c(1556, 1671), c(2455, 2730))
.Ответы:
Это простое решение от Google: http://en.wikipedia.org/wiki/Statistical_hypothesis_testing
Таким образом, вы хотели бы проверить следующую нулевую гипотезу против данной альтернативы
H A : p 1 ≠ p 2ЧАС0: p1= р2 противЧАСA: p1≠ р2
Так что вам просто нужно рассчитать статистику теста, которая
где .п^= n1п^1+ n2п^2N1+ n2
Итак, теперь в вашей задаче , , и р 2=0,612п1=2455п2=2730.п^1= 0,634 п^2= 0,612 N1= 2455 N2= 2730
Как только вы вычислите статистику теста, вам просто нужно вычислить соответствующее значение критической области, чтобы сравнить статистику теста. Например, если вы проверяете эту гипотезу на уровне достоверности 95%, вам необходимо сравнить статистику теста со значением критической области (для этого двухстороннего теста).Zα / 2= 1,96
Теперь, если вы можете отклонить нулевую гипотезу, в противном случае вам не удастся отклонить нулевую гипотезу.Z> зα / 2
Хорошо, это решение работает для случая, когда вы сравниваете две группы, но оно не обобщается на случай, когда вы хотите сравнить 3 группы.
Тем не менее, вы можете использовать критерий Chi Squared, чтобы проверить, имеют ли все три группы одинаковые пропорции, как предложено @Eric в его комментарии выше: «Помогает ли этот вопрос? Stats.stackexchange.com/questions/25299/… - Eric»
источник
В R ответ рассчитывается как:
источник
Просто резюме:
Ответы Дэна и Абаумана предполагают тестирование по биномиальной модели, где нулевая гипотеза представляет собой единую модель с одним биномиальным значением, среднее значение которого оценивается по эмпирическим данным. Их ответы верны в теории, но они нуждаются в приближении с использованием нормального распределения, поскольку распределение тестовой статистики не совсем соответствует нормальному распределению. Поэтому это правильно только для большого размера выборки.
Но ответ Дэвида указывает на непараметрический тест с использованием теста Фишера. Информация здесь: https://en.wikipedia.org/wiki/Fisher%27s_exact_test. И его можно применять к небольшим размерам выборки, но трудно рассчитать для больших размеров выборки.
Какой тест использовать, и насколько вы доверяете своему p-значению, остается загадкой. Но всегда есть предубеждения в зависимости от того, какой тест выбрать.
источник
источник
В Python statsmodels имеет функцию с именем
proportions_ztest
. Вот пример его использования:Это распечатывает:
источник
Оригинальный пост: ответ Дэна на самом деле неправильный, никого не обидеть. Z-тест используется только в том случае, если ваши данные соответствуют стандартному нормальному распределению. В этом случае ваши данные соответствуют биномиальному распределению, поэтому используйте критерий хи-квадрат, если ваша выборка велика, или критерий Фишера, если ваша выборка мала.
Изменить: Моя ошибка, извинения перед @Dan. Z-тест действителен здесь, если ваши переменные независимы. Если это предположение не выполнено или неизвестно, z-тест может быть недействительным.
источник