У меня от 3 до 5 показателей качества на человека в двух разных состояниях (A и B).
Я черчения в среднем для каждого человека в каждом состоянии , и я использую стандартную ошибку ( то есть , , с = число измерений) как погрешностями.SD/N−−√N
Теперь я хочу построить график разницы между средним показателем на человека в условии A и условии B. Я знаю, что могу определить распространенную ошибку, выполнив:
SD=SD2A+SD2B−−−−−−−−−−√
но как я могу распространять стандартные ошибки (так как я имею дело со средними значениями измерений) вместо стандартных отклонений? Имеет ли это смысл вообще?
Вы должны просто рассматривать свой SE как SD и использовать точно такие же формулы распространения ошибок. Действительно, стандартная ошибка среднего - это не что иное, как стандартное отклонение вашей оценки среднего, поэтому математика не меняется. В вашем конкретном случае, когда вы оцениваете SE для и знаете , , и , тогдаC=A−Bσ2Aσ2BNANB
SEC=σ2ANA+σ2BNB−−−−−−−−−√.
Обратите внимание, что другой вариант, который может показаться разумным, неверен:
SEC≠σ2Aσ2BNA+NB−−−−−−−−√.
Чтобы понять почему, представьте, что , но в одном случае у вас много наблюдений, а в другом - только одно: . Стандартная ошибка среднего для первой группы равна 0,1, а для второй - 1. Теперь, если вы используете вторую (неправильную) формулу, вы получите приблизительно 0,14 в качестве общей стандартной ошибки, которая слишком мала, учитывая, что вам второе измерение известно . Правильная формула дает , что имеет смысл.Н = 100 , N B = 1 ± 1 ≈ 1σ2A=σ2B=1NA=100,NB=1±1≈1
+1 Это основа для формулы неравной дисперсии, размера неравной выборки для t-статистики Стьюдента .
whuber
-2
Так как вы знаете количество измерений, мой первый инстинкт должен был бы просто вычислить распространенное SD, а затем вычислить SE из распространенного SD, разделив его на квадратный корень из N, как показано в уравнении выше.
Я считаю, что это неправильно. Пожалуйста, смотрите мой ответ для объяснения почему.
амеба
Ах я вижу. Я не учел неравные размеры выборки. Спасибо за объяснение, @amoeba. Если у вас есть время, чтобы помочь мне понять мои мысли; в ситуации, когда размеры выборки были равны, предложенный мной выше метод был бы верным, верно?
Так как вы знаете количество измерений, мой первый инстинкт должен был бы просто вычислить распространенное SD, а затем вычислить SE из распространенного SD, разделив его на квадратный корень из N, как показано в уравнении выше.
источник