Предположим, я провожу эксперимент, который может иметь 2 результата, и я предполагаю, что базовое «истинное» распределение 2 результатов - это биномиальное распределение с параметрами и : .
Я могу вычислить стандартную ошибку, , из формы дисперсии : где . Итак, . Для стандартной ошибки я получаю: , но я где-то видел, что . Что я сделал не так?
binomial
standard-error
Фрэнк
источник
источник
Ответы:
Похоже, что вы используете дважды двумя разными способами - и как размер выборки, и как число испытаний Бернулли, составляющих биномиальную случайную величину; чтобы устранить двусмысленность, я буду использовать для обозначения последнего.n k
Если у вас есть независимых выборок из распределения , дисперсия среднего значения выборки равнаn Binomial(k,p)
где и - это одно и то же среднее. Это следует сq=1−p X¯¯¯¯
(1) , для любой случайной величины, , и любой постоянной .var(cX)=c2var(X) cX c
(2) дисперсия суммы независимых случайных величин равна сумме дисперсий .
Стандартная ошибка - это квадратный корень из дисперсии: . Следовательно, √X¯¯¯¯ kpqn−−−√
Когда , вы получаете формулу, которую вы указали:√k=n pq−−√
Когда , а биномиальные переменные являются всего лишь испытаниями Бернулли , вы получаете формулу, которую вы видели в другом месте:√k=1 pqn−−√
источник
Легко запутать два биномиальных распределения:
npq - это число успехов, а npq / n = pq - это соотношение успехов. Это приводит к различным стандартным формулам ошибок.
источник
Мы можем посмотреть на это следующим образом:
Теперь, если мы посмотрим на дисперсию , . Но для всех отдельных экспериментов Бернулли . Поскольку в эксперименте имеется бросков или испытаний Бернулли, . Это означает, что имеет дисперсию .Y V(Y)=V(∑Xi)=∑V(Xi) V(Xi)=pq n V(Y)=∑V(Xi)=npq Y npq
Теперь пропорция выборки задается как , что дает «пропорцию успеха или голов». Здесь является константой, так как мы планируем принять одинаковое количество монет для всех экспериментов в популяции.p^=Yn n
Итак, .V(Yn)=(1n2)V(Y)=(1n2)(npq)=pq/n
Итак, стандартная ошибка для (пример статистики)p^ pq/n−−−−√
источник
$x$
дает .Я думаю, что в первоначальном посте также есть некоторая путаница между стандартной ошибкой и стандартным отклонением. Стандартное отклонение является квадратом дисперсии распределения; Стандартная ошибка - это стандартное отклонение оценочного среднего значения выборки от этого распределения, т. е. разброс средних значений, которые вы бы наблюдали, если бы вы делали эту выборку бесконечно много раз. Первое является внутренним свойством распределения; последнее является мерой качества вашей оценки свойства (среднего) распределения. Когда вы проводите эксперимент из испытаний N Бернуилли для оценки неизвестной вероятности успеха, неопределенность вашего оценочного значения p = k / N после наблюдения k успехов является стандартной ошибкой расчетной доли, sqrt (pq / N), где q = 1 -п. Истинное распределение характеризуется параметром P, истинной вероятностью успеха.
источник