Как я могу проверить, отличается ли среднее значение (например, артериальное давление) подгруппы (например, тех, кто умер) от всей группы (например, всех, у кого было заболевание, включая тех, кто умер)?
Ясно, что первый является подгруппой второго.
Какой тест гипотезы я должен использовать?
hypothesis-testing
group-differences
user1061210
источник
источник
Ответы:
Как отмечает Майкл, при сравнении подгруппы с общей группой исследователи обычно сравнивают подгруппу с подгруппой общей группы, которая не включает подгруппу.
Подумайте об этом таким образом.
Если - доля умерших, а - доля умерших , ип 1 - р
гдеявляется общим средним значением, является средним из тех, кто умер, а является средним из тех, кто еще жив. затемИкс¯, Икс¯d Икс¯a
Предположим, что . Следовательно, .Иксd¯≠Xa¯ Икс,¯≠ р Xd¯+ ( 1 - p ) Xd¯= Xd¯
Предположим, . Следовательно, , затем и поскольку , то . ¯ Х d ≠р ¯ Х д +(1-р) ¯ Х (1-р) ¯ Х d ≠(1-р) ¯ Х (1-р)≠0 ¯ Х d ≠ ¯ X aИкс,¯≠ Xd¯ Иксd¯≠ р Xd¯+ ( 1 - p ) Xa¯ ( 1 - р ) Хd¯≠ ( 1 - p ) Xa¯ ( 1 - р ) ≠ 0 Иксd¯≠ Xa¯
То же самое можно сделать для неравенства.
Таким образом, исследователи обычно проверяют разницу между подгруппой и подмножеством общей группы, которая не включает подгруппу. Это показывает, что подгруппа отличается от общей группы. Это также позволяет использовать обычные методы, такие как t-критерий независимых групп.
источник
Чтобы проверить здесь, нужно сравнить тех, кто заболел и умер, с теми, кто заболел и не умер. Вы можете применить t-критерий из двух выборок или критерий суммы рангов Уилкоксона, если нормальность не может быть принята.
источник
Что вам нужно сделать, это проверить пропорции населения (большой размер выборки). Статистические данные о доле населения часто имеют большой размер выборки (n => 30), поэтому нормальное распределение аппроксимации и соответствующие статистические данные используются для определения критерия того, соответствует ли доля выборки (артериальное давление умерших) доле населения (каждый). у кого было заболевание, в том числе и тех, кто умер).
То есть, когда размер выборки больше или равен 30, мы можем использовать статистику z-показателя, чтобы сравнить пропорцию выборки с долей населения, используя значение p-hat стандартного отклонения выборки, чтобы оценить стандартное отклонение выборки, p если не известно.
Распределение выборки P (пропорции) приблизительно нормальное со средним или ожидаемым значением, E (P) = p-hat и стандартная ошибка, сигма (r) = sqrt (p * q / n).
Ниже приведены вероятные вопросы гипотезы теста, которые можно задать при сравнении двух пропорций:
H0: p-hat = p против H1: p-hat не равен p
H0: p-hat = p против H1: p-hat> p
H0: p-hat = p против H1: p-hat <p
Статистика, используемая для проверки большого размера выборки:
Статистика теста связана со стандартным нормальным распределением:
Статистика z-показателя для пропорций
п-HAT-P / SQRT (рд / п)
где p = оценка доли, q = 1-p и доля населения.
Пропорция означает:
np / n = p-hat = x / n
Среднеквадратичное отклонение:
= sqrt (npq / n) = sqrt (pq / n)
Правила принятия решений:
Тест с верхним хвостом (): (H0: P-hat> = P)
Примите H0, если Z <= Z (1-альфа)
Отклонить H0, если Z> Z (1-альфа)
Тест с нижним хвостом (Ha: P-hat <= P):
Примите H0, если Z> = Z (1-альфа)
Отклонить H0, если Z
Двусторонний тест (Ха: P-шляпа не равна P):
Примите H0, если Z (альфа / 2) <= Z <= Z (1-альфа / 2)
Отклонить H0, если Z <Z (альфа / 2) или если Z> Z (1-альфа / 2)
источник