Почему t-тест необходим, если у нас есть z-тест?

9

Может кто-нибудь дать объяснение, почему t-тест «происходит»? Меня учили пользоваться t-тестом, когда вы не знаете стандартное отклонение популяции (т.е. вы знаете только стандартное отклонение вашей выборки), но я не уверен, почему это отличает его от z-теста ,

jasonbogd
источник
Я обновил ваш заголовок, чтобы ответить на вопрос, который, как мне кажется, вы задаете; не стесняйтесь редактировать, если я неправильно истолковал
Jeromy Anglim

Ответы:

3

Я не думаю, что понимаю ваш вопрос полностью. Вы спрашиваете, почему вы бы использовали t-тест?

Если вы понимаете, почему вы используете z-тест, у вас должно быть хорошее представление о том, почему вы должны использовать t-тест. Для больших выборок z-тест и t-тест должны давать схожие или идентичные результаты. Но в то время как z-критерий предполагает нормальное распределение, t-критерий учитывает неопределенность в распределении выборки при меньших размерах выборки.

Бенджамин Мако Хилл
источник
3
Хм-м t-критерий также предполагает нормальное распределение. Возможно, вы хотели сказать, что нам требуется меньше информации об этом распространении.
JohnK
@JohnK Я не думаю, что имеет смысл говорить, что тест предполагает распределение в первую очередь, но я думаю, что Бенджамин имел в виду, что t-оценка / статистика предполагает T-распределение, а не Z-распределение.
Датораки
3

Сам z-тест на самом деле является тестом отношения правдоподобия между вероятностью, предполагающей нулевую гипотезу, и вероятностью, предполагающей альтернативную гипотезу. Предполагая лежащие в основе нормальные распределения с известными дисперсиями и проверяя только средние значения, алгебра упрощается до z-критерия, который мы знаем и любим (DeGroot 1986, с. 442–447).

Используя ту же процедуру максимального правдоподобия, но рассматривая дисперсию как неизвестную, создаем другую пару правдоподобий и их отношение, а упрощение алгебры дает статистику: (DeGroot 1986, с. 485–489). Изменяемое тестовое распределение также изменяется, поскольку числитель вышеуказанной статистики обычно распределяется, , а знаменатель распределяется как квадратный корень из квадратов нормалей, , который является квадратным корнем из случайная величина хи-квадрат. Госсет (студент) показал, что если у вас есть случайная величина: ˉХS2Y~N(0,1)

n(X¯nμ0)Sn2n1
X¯S2
YN(0,1)Zχn2XYZn
тогда X распределяется с t-распределением и n степенями свободы.

Таким образом, чтобы сформулировать это без строгости, t-тест является естественным результатом того же процесса отношения правдоподобия, который стоит за z-тестом, когда дисперсия данных сама по себе неизвестна и оценивается по максимальной вероятности.

Авраам
источник
1
это было очень поучительно. Я полностью забыл, что t-тест прибывает из максимально вероятного
Модерат
1

Не точный ответ заключается в том, что вы хотите использовать t-тест, когда у вас небольшое количество выборок из-за вероятности того, что выборки необычно близко друг к другу (относительно фактической дисперсии совокупности). В этом случае знаменатель в формуле для t-статистики будет необычайно мал, и поэтому сама t-статистика будет необычно большой. Таким образом, у вас гораздо больше шансов получить большое значение для t-stat, когда у вас есть небольшое количество выборок, чем для получения сравнительно большого z-stat, поэтому вам нужно большее значение, чтобы отклонить ноль, используя t-тест, чем z-тест на том же уровне значимости.

Эван Райт
источник
Я считаю аргумент привлекательным, но, если подумать, неубедительным. В конце концов, если случайно образцы необычно далеко друг от друга (что должно происходить так же легко, как и необычно близко), то, похоже, та же самая логика приведет к противоположному выводу.
whuber