Как проверить медиану населения?

9

У меня есть образец 250 единиц. Распределение асимметрично. Я хочу проверить гипотезу о том, что медиана популяции отличается от 3,5, поэтому я думаю, что тест с одной выборкой будет уместным. Я знаю, что критерий ранга Уилкоксона не подходит, потому что распределение не симметрично. Подходит ли тест знака? Если это не так, может кто-нибудь порекомендовать какой-либо другой тест?

LeonRupnik
источник
3
Вы потеряли меня на первой линии по нескольким причинам. (1) Образец не может иметь гауссово распределение (но может приблизительно иметь его). (2) Одной из характеристик всех гауссовских распределений (и, следовательно, приближений к ним) является симметрия . Вы противоречили себе. Описывая свои данные в своих собственных терминах, а не в статистическом жаргоне, вы будете лучше передавать то, что имеете. Не могли бы вы также объяснить, насколько это возможно, что вы действительно хотите достичь с помощью ваших данных? Какую информацию вам может дать «образец теста на основе медианы»?
whuber
1
Медиана образца - то, что это; не было бы необходимости проверять это. Возможно, вы хотите проверить, равна ли медиана популяции (из которой получена выборка) ? Если это так, важно знать, как было разработано значение 3,5 . Возможно, это краткое изложение какого-то другого набора данных? Или это какое-то заранее определенное число, например, стандарт качества? 3.53.5
whuber
1
Это заранее определенное число
LeonRupnik
2
« Распределение асимметрично, поэтому я хочу проверить гипотезу, если медиана популяции отличается от 3,5 ...» - Почему асимметрия в выборке влияет на то, какая гипотеза интересна?« Является ли тест знака приемлемым для использования? » - конечно, но (по крайней мере, в исходной форме) он основан на преемственности - вам нужно адаптировать его, если ваша переменная дискретна (вы не говорите, из чего состоят ваши данные) ,
Glen_b
Данные непрерывны
LeonRupnik

Ответы:

8

конспект

3.5pp=1/2p1/2

Остальная часть этого поста объясняет базовую модель и показывает, как выполнять вычисления. Он предоставляет рабочий Rкод для их выполнения. Подробное изложение основной теории проверки гипотез приведено в моем ответе на вопрос: «Что означают значения p и значения t в статистических тестах?». ,

Статистическая модель

3.51/2=50%3.53.52503.5(250,1/2)k

3.53.51/2

Нахождение подходящего теста

k1/225012512502501253.5

ααk

3.5α/2kα/2kk

Технически, есть два распространенных способа выполнить вычисление: вычислить биномиальные вероятности или приблизить их с помощью нормального распределения.

Расчет с биномиальными вероятностями

Используйте функцию процента (квантиль). В R, например, это называется qbinomи будет вызываться как

alpha <- 0.05 # Test size
c(qbinom(alpha/2, 250, 1/2)-1, qbinom(1-alpha/2, 250, 1/2)+1)

α=0.05

109 141

k0109k141250Rk

pbinom(109, 250, 1/2) + (1-pbinom(141-1, 250, 1/2))

0.0497αα

Расчет с нормальным приближением

(250,1/2)250×1/2=125250×1/2×(11/2)=250/4250/47.9α/2=0.05/21.95996R

qnorm(alpha/2)

0.05/2+1.95996k1.95996125125±7.9×1.96109.5,140.5

250*1/2 + sqrt(250*1/2*(1-1/2)) * qnorm(alpha/2) * c(1,-1)

k109141p1/201α


Этот тест, поскольку он не предполагает ничего о населении (за исключением того, что он не имеет большой вероятности, ориентированной прямо на его медиану), не так силен, как другие тесты, которые делают конкретные предположения о населении. Если тест, тем не менее, отклоняет ноль, нет необходимости беспокоиться о нехватке мощности. В противном случае вы должны сделать несколько деликатных компромиссов между тем, что вы готовы принять, и тем, что вы можете сделать о населении.

Whuber
источник
2
Поскольку это практически рабочий пример вашего довольно более абстрактного ответа « значение p-значения », не только в поддержке той же философии, но и в том, как структурирован ваш ответ, я думаю, что вы должны связать его («Пример как это применяется на практике, можно узнать из моего ответа на ... ") в заключении вашего ответа там.
Серебряная рыба
2
@ Серебро Спасибо; это действительно приходило мне в голову. Я думал, что мог бы немного подождать сначала. Среди прочего, я не удивлюсь, если какой-нибудь предприимчивый член сообщества выкопает дублирующую ветку, которую я хотел бы изучить более подробно. В конце концов, это основной материал - множество вопросов о биномиальных тестах. Единственная претензия, которую он предъявляет к тому, чтобы быть новой, - это то, что он прибыл сюда для проверки на медиану - так что с самого начала это был не так явно биномиальный тест - и единственное утверждение, что мой ответ должен быть достойным чтение лежит в его усилиях, чтобы объяснить каждый шаг.
whuber