Я не могу найти общий метод для получения стандартных ошибок в любом месте. Я смотрел на Google, этот веб-сайт и даже в учебниках, но все, что я могу найти, - это формула для стандартных ошибок среднего, дисперсии, пропорции, степени риска и т. Д., А не то, как были получены эти формулы.
Если бы кто-то мог объяснить это простыми словами или даже связать меня с хорошим ресурсом, который объясняет это, я был бы благодарен.
standard-error
Даниэль Гардинер
источник
источник
Ответы:
То, что вы хотите найти, - это стандартное отклонение выборочного распределения среднего значения. Т.е. на простом английском языке выборочное распределение - это когда вы выбираете элементов из своего населения, складываете их вместе и делите сумму на . Затем мы находим дисперсию этой величины и получаем стандартное отклонение, взяв квадратный корень из этой дисперсии.нN N
Итак, пусть выбранные вами элементы будут представлены случайными переменными , каждая из которых одинаково распределена с дисперсией . Они независимо выбираются, поэтому дисперсия суммы является просто суммой дисперсий. σ 2 Var ( п Σ я = 1 X я ) = п Σ я = 1 Var ( X я ) = п Σ я = 1 σ 2 = п σ 2Икся, 1 ≤ i ≤ n σ2
Далее мы делим на . В общем, мы знаем, что , поэтому, положив мы имеемVar ( k Y ) = k 2 Var ( Y ) k = 1 / nN Var( к Y) = к2Var( Y) k = 1 / n
Наконец, возьмите квадратный корень, чтобы получить стандартное отклонение . Если стандартное отклонение популяции отсутствует, в качестве оценки используется стандартное отклонение выборки в результате чего получается .σN--√ s sN--√
Все вышесказанное верно независимо от распределения , но возникает вопрос: что вы на самом деле хотите сделать со стандартной ошибкой? Как правило, вы можете захотеть построить доверительные интервалы, и тогда важно назначить вероятность для построения доверительного интервала, который содержит среднее значение.Икся
Если ваши нормально распределены, это легко, потому что тогда распределение выборки также нормально распределено. Можно сказать, что 68% выборок среднего значения будут находиться в пределах 1 стандартной ошибки истинного среднего значения, 95% будут в пределах 2 стандартных ошибок и т. Д.Икся
Если у вас достаточно большая выборка (или меньшая выборка, и значения не слишком ненормальны), вы можете вызвать центральную предельную теорему и сказать, что распределение выборки распределено приблизительно нормально, и ваши вероятностные утверждения также приблизительны.Икся
Примером является оценка доли , где вы рисуете элементов из распределения Бернулли. Дисперсия каждого распределения равна и, следовательно, стандартная ошибка равна (доля оценивается с использованием данных). Чтобы потом сказать, что примерно несколько% выборок находятся в пределах стольких стандартных отклонений от среднего значения, вам необходимо понять, когда распределение выборок примерно нормальное. Повторная выборка из распределения Бернулли такая же, как выборка из биномиального распределения, и одно общее практическое правило - приближаться только тогда, когда и равнынп N Икся р ( 1 - р ) pnpn(1-p)≥5p ( 1 - p ) / n---------√ п п р n ( 1 - p ) ≥ 5 , (См. Википедию для более глубокого обсуждения приближения биномиального с нормальным. См. Здесь для рабочего примера стандартных ошибок с пропорцией.)
Если, с другой стороны, ваше распределение выборки не может быть аппроксимировано нормальным распределением, тогда стандартная ошибка намного менее полезна. Например, при очень искаженном асимметричном распределении вы не можете сказать, что один и тот же% выборок будет стандартным отклонением по обе стороны от среднего значения, и вы можете захотеть найти другой способ связать вероятности с выборками.± 1
источник
Стандартной ошибкой является стандартное отклонение статистики (при нулевой гипотезе, если вы тестируете). Общий метод для нахождения стандартной ошибки состоит в том, чтобы сначала найти функцию распределения или производящую момент вашей статистики, найти второй центральный момент и взять квадратный корень.
Есть ярлыки, как будто вам не обязательно находить распределение статистики, но я думаю, что концептуально полезно иметь распределения в уме, если вы их знаете.
источник