Для чего используется стандартная ошибка?

9

Я использую учебник, который я нашел, и вычерчиваю средние значения вместе со стандартными ошибками, чтобы показать мои данные. Но у меня проблема с обсуждением результатов. Мой график такой, как показано ниже: некоторые стандартные ошибки (показанные в виде панели ошибок) сильно различаются, а некоторые очень близки к нулю.

введите описание изображения здесь

Беркай
источник
2
Побочной проблемой здесь является то, что использование баров может оказаться запутанным. Как правило, нисходящие бары работают немного сложнее, чем восходящие. Более фундаментально, бары, начинающиеся с 1e-3, являются произвольными. Более того, показ точных оценок по точечным символам и добавление баров ошибок было бы намного проще, чем отображение баров плюс баров ошибок. Google "динамитный сюжет" для большего.
Ник Кокс
Я не уверен, в чем вопрос. Основываясь на ответе, который вы пометили как правильный и заголовок, вы можете просто знать, что такое стандартная ошибка. Но, исходя из того, что у вас есть, кажется, вам нужна помощь в описании данных. Не могли бы вы уточнить в вопросе? Кроме того, если вам нужна помощь в описании данных, пожалуйста, расскажите больше о данных, а не только о рисунке. N в каждой группе и то, что означают значения, будет полезно. Любые сделанные преобразования также будут полезны.
Джон

Ответы:

10

Шкалы ошибок в целом должны убедить читателя в том, что различия, которые она / он видит на графике, являются статистически значимыми. В приближении вы можете представить себе небольшой гауссиан, диапазон которого отображается в виде этой строки ошибок - «визуальная интеграция» произведения двух таких гауссианов более-менее вероятна, что эти два значения действительно равны.±1σ

В этом конкретном случае можно видеть, что разница между красным и фиолетовым столбцом, а также серым и зеленым не слишком значительна.


источник
как насчет стандартной ошибки в этом случае? а построены бары ошибок.
Беркай
Это плохая ошибка, если это цель. Неперекрытие столбцов недостаточно для статистической значимости, а величина неперекрытия, необходимая для того, чтобы на самом деле значительно отличаться при 0,05, зависит от N. И что, черт возьми, означает «не слишком значительный»? Оба этих предельных условия, на которые вы указываете, не пройдут t-критерий.
Джон
@John Как я уже писал, индикаторы ошибок - это визуальный ключ, помогающий проводить специальные оценки при исследовании сюжета; Фактическое тестирование нуждается в некоторой гипотезе для проверки, поэтому, очевидно, это должно произойти в тексте.
11

В общем, стандартная ошибка говорит вам, насколько вы уверены, что истинное значение вершины бара находится там, где оно написано. Когда имеется несколько столбцов, он также может включать сравнения между столбцами в смысле статистического теста. Однако их интерпретация требует некоторых допущений, показанных графически ниже. Если вы действительно заинтересованы в сравнении столбцов, чтобы увидеть, являются ли различия статистически значимыми, то вам следует запустить тесты на данных и показать, какие тесты были значимыми, например, так.

сравнение значимости

Кроме того, я бы предложил использовать доверительные интервалы, а не стандартные ошибки.

Эта статья заслуживает прочтения:

Камминг и Финч. «Вывод на глаз: доверительные интервалы и как читать изображения данных». Я Псих. Том 60, № 2, 170–180.

Их общий вывод таков: «Ищите столбцы, которые имеют непосредственное отношение к интересующим эффектам, учитывают план эксперимента и интерпретируют интервалы».

Для независимых выборок, использующих доверительные интервалы, половинное перекрытие CI означает, что разница статистически значима.

независимые бары

Для независимых выборок, использующих вместо этого стандартные полосы ошибок, на следующем графике показано, как определить статистическую значимость:

Indep Bar, SE

Ари Б. Фридман
источник
Это не совсем ответ (пока). Не могли бы вы дополнить эту цитату некоторыми сведениями о том, как она помогает ответить на вопрос ОП? (кстати, я не downvoter)
Восстановить Монику
1
@gung Реальная жизнь вмешалась, поэтому я отправил частичный ответ. Обновлено.
Ари Б. Фридман
6

Как говорит mbq, полосы ошибок - это способ дать вашим читателям почувствовать, являются ли различия между двумя группами значительными, то есть, если различия в каждой из ваших групп достаточно малы, чтобы полагать, что разница, которую вы нашли для среднего значения между вашими группами.

При прочих равных, большие полосы ошибок означают большую разницу внутри группы, но похоже, что ось Y вашего графика преобразована в лог, поэтому нижние группы не совсем в том же масштабе, что и более высокие.

Вы должны знать, что многие из ваших читателей не поймут, что означают полосы ошибок, даже если вы объясните это явно! Часто вы можете достичь одной и той же цели с помощью точечного точечного графика или прямоугольника (или обоих вместе) для достижения одинакового эффекта.

Дэвид Ш
источник
Что касается статьи, которую вы упомянули, это интересное наблюдение, но для меня это не удивительно. Я нахожу значительную часть статистических концепций и общепринятых практик запутанной и запутанной (хотя у меня большой опыт работы в математике и я прошел ряд курсов по математической статистике). Лично я чувствую, что многие концепции было бы намного легче понять, если бы они преподавались визуально и с использованием примеров вместо длинных и запутанных устных объяснений.
Посеф