Изображение ниже из этой статьи в психологической науке . Коллега указал на две необычные вещи об этом:
- Согласно подписи, столбцы ошибок показывают «± 2,04 стандартных ошибок, 95% доверительный интервал». Я только видел, как ± 1,96 SE использовался для 95% -ного КИ, и я не могу найти ничего о том, что 2.04 SE используется для каких-либо целей. Имеет ли 2.04 SE какое-то общепринятое значение ?
- В тексте говорится, что запланированные парные сравнения обнаружили существенные различия для средней величины испуга в ошибке по сравнению с правильными предсказуемыми испытаниями (t (30) = 2,51, р <0,01) и ошибками по сравнению с правильными непредсказуемыми испытаниями (t (30) = 2,61, р <.01) (критерий омнибуса F также был значимым при p <.05). Тем не менее, график показывает столбцы ошибок для всех трех условий, существенно перекрывающихся. Если интервалы ± 2,04 SE совпадают, как значения могут значительно отличаться при p <0,05? Перекрытие достаточно велико, поэтому я предполагаю, что интервалы ± 1,96 SE также перекрываются.
Ответы:
Средства сравниваются с точки зрения стандартных ошибок . Стандартная ошибка обычно в раз стандартного отклонения, где (предположительно около здесь) - размер выборки. Если заголовок является правильным при названии этих столбцов «стандартными ошибками», то стандартные отклонения должны быть как минимум раз больше, чем значения приблизительно как показано. Набор данных из положительных значений со стандартным отклонением и средним значением от до должен иметь большинство значений около1/n−−√ n 30+1=31 31−−√≈5.5 6 31 6×5.5=33 14 18 0 и небольшое количество колоссальных ценностей, что кажется маловероятным. (Если бы это было так, тогда весь анализ, основанный на статистике Стьюдента, в любом случае был бы неверным.) Мы должны сделать вывод, что на рисунке, скорее всего, показаны стандартные отклонения, а не стандартные ошибки .
Сравнение средних значений не основано на перекрытии (или его отсутствии) доверительных интервалов. Два 95% ДИ могут перекрываться, но все же могут свидетельствовать о значительных различиях. Причина заключается в том, что стандартная ошибка разности ( независимых ) средних составляет, по меньшей мере, приблизительно, квадратный корень из суммы квадратов стандартных ошибок средних. Например, если стандартная ошибка среднего равна а стандартная ошибка среднего равна , то CI первого среднего (с кратным ) увеличится с до а CI второй продлится с14 1 17 1 2.04 11.92 16.08 14.92 до , с существенным перекрытием. Тем не менее SE разности будет равно . Разница средних, , более чем в раза превышает это значение: она значительна.19.03 12+12−−−−−−√≈1.41 17−14=3 2.04
Это парные сравнения. Отдельные значения могут демонстрировать большую изменчивость, в то время как их различия могут быть весьма непротиворечивыми. Например, набор пар, таких как , , , и т. Д., вариации в каждом компоненте, но различия последовательно составляют . Хотя эта разница невелика по сравнению с любым из компонентов, ее согласованность показывает, что она статистически значима.( 15 , 15.01 ) ( 16 , 16.01 ) ( 17 , 17.01 ) 0.01(14,14.01) (15,15.01) (16,16.01) (17,17.01) 0.01
источник
F(2,60)=5.64, p<.05
), подразумевает, что это был тест с повторными измерениями, так что, скорее всего, были и специальные тесты.Часть путаницы здесь - это запутанное представление данных. Похоже, что это план повторных измерений, но столбцы ошибок - это доверительные интервалы того, насколько хорошо было оценено истинное среднее значение. Основная цель повторных измерений - избежать сбора достаточного количества данных для получения качественной оценки необработанного среднего значения. Поэтому полосы ошибок, подобные представленным, действительно не имеют никакого отношения к рассказываемой истории. Значение критического интереса - это эффект. С учетом того, что графики должны быть направлены на то, чтобы осветить основной смысл истории, графическое представление эффектов и их доверительных интервалов было бы более уместным.
источник