Я имел в виду эту видео-лекцию для расчета доверительного интервала . Однако у меня есть некоторая путаница. Этот парень использует -статистику для расчета. Тем не менее, я думаю, что это должна была быть статистика. Нам не дано истинное стандартное отклонение населения. Мы используем выборочное стандартное отклонение, чтобы оценить истинное.
Так почему он взял нормальное распределение для доверительного интервала, а не ?
confidence-interval
t-distribution
user34790
источник
источник
n <- 36; diff <- 12; sd <- 40; 2 * (pt(diff/(sd/sqrt(n)), df = n - 1) - 0.5) = 0.9195145
.Ответы:
Вы правы, это должен быть t-дистрибутив. Но так как размер выборки составляет 36 (то есть> 20), распределение z также будет уместным. Помните, что с ростом размера выборки t-распределение становится все более похожим на z-распределение по форме.
источник
Когда я проходил свой первый курс статистики (после динозавров, но когда настоящие компьютеры все еще занимали целую комнату), нас учили пользоваться таблицей z, если было более 30 степеней свободы, отчасти потому, что таблица t в книге только поднялся до 30 степеней свободы, и если вы посмотрите на t-таблицу, то увидите, что где-то около 28 степеней свободы вы получите те же результаты, что и в таблице z, с двумя значащими цифрами (и при выполнении всего этого вручную мы имели тенденцию округлять чаще). Возможно, ведущий все еще из этой школы.
Вы правы в том, что если вы используете выборочное стандартное отклонение для теста, то это означает, что вы действительно должны использовать распределение t независимо от размера (что гораздо проще сделать в наши дни) и использовать z (стандартное нормальное значение), когда вы знайте стандартное отклонение популяции, но для практических целей вы не увидите значимой разницы, если размер выборки велик.
источник
Мне трудно понять, просто ли Хан слишком упростил вещи в видео или он просто неправ. Я бы сказал последнее, но проблема не в вопросе z или t . Он называет то, что рассчитывает доверительный интервал, а затем говорит, что на 92% уверен, что среднее значение популяции находится в заданном диапазоне. Это просто не то, что вы делаете вывод из доверительного интервала ... к сожалению.
Итак, я возвращаюсь к вопросу t против z и начинаю задаваться вопросом, допустил ли он там ошибку. Я думаю, что, возможно, не потому, что он заявляет, что если образец меньше, вы должны внести поправку. Так что другие ответчики, вероятно, правы в этом. Он просто использует z, потому что он уже представил его, и он достаточно близок к n из 36. Я не планирую просматривать все видео, но я предполагаю, что он представит дистрибутив t позже, надеюсь, следующий.
Очень жаль, что Академия Хана ошибается во многих областях статистики ... но, может быть, я просто так чувствую, потому что мне указывают только на видео с проблемами.
источник