Путаница относительно того, когда использовать статистику против статистики

15

Я имел в виду эту видео-лекцию для расчета доверительного интервала . Однако у меня есть некоторая путаница. Этот парень использует -статистику для расчета. Тем не менее, я думаю, что это должна была быть статистика. Нам не дано истинное стандартное отклонение населения. Мы используем выборочное стандартное отклонение, чтобы оценить истинное.ZT

Так почему он взял нормальное распределение для доверительного интервала, а не ?T

user34790
источник
Так же , как ссылки, разработка проблемы подвергается на видео с т статистики даст: n <- 36; diff <- 12; sd <- 40; 2 * (pt(diff/(sd/sqrt(n)), df = n - 1) - 0.5) = 0.9195145.
Антони Пареллада

Ответы:

10

Вы правы, это должен быть t-дистрибутив. Но так как размер выборки составляет 36 (то есть> 20), распределение z также будет уместным. Помните, что с ростом размера выборки t-распределение становится все более похожим на z-распределение по форме.

Grayskin
источник
21

Когда я проходил свой первый курс статистики (после динозавров, но когда настоящие компьютеры все еще занимали целую комнату), нас учили пользоваться таблицей z, если было более 30 степеней свободы, отчасти потому, что таблица t в книге только поднялся до 30 степеней свободы, и если вы посмотрите на t-таблицу, то увидите, что где-то около 28 степеней свободы вы получите те же результаты, что и в таблице z, с двумя значащими цифрами (и при выполнении всего этого вручную мы имели тенденцию округлять чаще). Возможно, ведущий все еще из этой школы.

Вы правы в том, что если вы используете выборочное стандартное отклонение для теста, то это означает, что вы действительно должны использовать распределение t независимо от размера (что гораздо проще сделать в наши дни) и использовать z (стандартное нормальное значение), когда вы знайте стандартное отклонение популяции, но для практических целей вы не увидите значимой разницы, если размер выборки велик.

Грег Сноу
источник
1
Отличный анекдот :)
swiecki
Одним неприятным побочным эффектом того факта, что иногда можно использовать z-интервалы, является то, что некоторые вводные тексты представляют z-интервалы вместо t-интервалов. Есть много областей науки, где выборки обычно настолько малы, что z-интервалы совершенно неуместны. Я рассказываю об этом своим студентам каждый год с четкими инструкциями, но все же значительное количество из них используют z-интервалы :-(
Майкл Лью,
4

Мне трудно понять, просто ли Хан слишком упростил вещи в видео или он просто неправ. Я бы сказал последнее, но проблема не в вопросе z или t . Он называет то, что рассчитывает доверительный интервал, а затем говорит, что на 92% уверен, что среднее значение популяции находится в заданном диапазоне. Это просто не то, что вы делаете вывод из доверительного интервала ... к сожалению.

Итак, я возвращаюсь к вопросу t против z и начинаю задаваться вопросом, допустил ли он там ошибку. Я думаю, что, возможно, не потому, что он заявляет, что если образец меньше, вы должны внести поправку. Так что другие ответчики, вероятно, правы в этом. Он просто использует z, потому что он уже представил его, и он достаточно близок к n из 36. Я не планирую просматривать все видео, но я предполагаю, что он представит дистрибутив t позже, надеюсь, следующий.

Очень жаль, что Академия Хана ошибается во многих областях статистики ... но, может быть, я просто так чувствую, потому что мне указывают только на видео с проблемами.

Джон
источник