Может кто-нибудь дать объяснение, почему t-тест «происходит»? Меня учили пользоваться t-тестом, когда вы не знаете стандартное отклонение популяции (т.е. вы знаете только стандартное отклонение вашей выборки), но я не уверен, почему это отличает его от z-теста ,
hypothesis-testing
t-test
jasonbogd
источник
источник
Ответы:
Я не думаю, что понимаю ваш вопрос полностью. Вы спрашиваете, почему вы бы использовали t-тест?
Если вы понимаете, почему вы используете z-тест, у вас должно быть хорошее представление о том, почему вы должны использовать t-тест. Для больших выборок z-тест и t-тест должны давать схожие или идентичные результаты. Но в то время как z-критерий предполагает нормальное распределение, t-критерий учитывает неопределенность в распределении выборки при меньших размерах выборки.
источник
Сам z-тест на самом деле является тестом отношения правдоподобия между вероятностью, предполагающей нулевую гипотезу, и вероятностью, предполагающей альтернативную гипотезу. Предполагая лежащие в основе нормальные распределения с известными дисперсиями и проверяя только средние значения, алгебра упрощается до z-критерия, который мы знаем и любим (DeGroot 1986, с. 442–447).
Используя ту же процедуру максимального правдоподобия, но рассматривая дисперсию как неизвестную, создаем другую пару правдоподобий и их отношение, а упрощение алгебры дает статистику: (DeGroot 1986, с. 485–489). Изменяемое тестовое распределение также изменяется, поскольку числитель вышеуказанной статистики обычно распределяется, , а знаменатель распределяется как квадратный корень из квадратов нормалей, , который является квадратным корнем из случайная величина хи-квадрат. Госсет (студент) показал, что если у вас есть случайная величина: ˉХS2Y~N(0,1)
Таким образом, чтобы сформулировать это без строгости, t-тест является естественным результатом того же процесса отношения правдоподобия, который стоит за z-тестом, когда дисперсия данных сама по себе неизвестна и оценивается по максимальной вероятности.
источник
Не точный ответ заключается в том, что вы хотите использовать t-тест, когда у вас небольшое количество выборок из-за вероятности того, что выборки необычно близко друг к другу (относительно фактической дисперсии совокупности). В этом случае знаменатель в формуле для t-статистики будет необычайно мал, и поэтому сама t-статистика будет необычно большой. Таким образом, у вас гораздо больше шансов получить большое значение для t-stat, когда у вас есть небольшое количество выборок, чем для получения сравнительно большого z-stat, поэтому вам нужно большее значение, чтобы отклонить ноль, используя t-тест, чем z-тест на том же уровне значимости.
источник
Хороший обзор основных предположений и различий (и сходств) обоих тестов дан здесь:
http://www.le.ac.uk/bl/gat/virtualfc/Stats/ttest.html
источник