Почему квадратный корень взят для выборки «N» в формуле стандартного отклонения?

9

Я пытаюсь понять очень основную концепцию стандартного отклонения.

Из формулы $\sigma= \sqrt{ \dfrac{ \sum\limits_{i=1}^n (x_i-\mu)^2} N }$

Я не могу понять, почему мы должны вдвое сократить население "N", то есть, почему мы хотим взять когда мы не делали ? Разве это не искажает население, которое мы рассматриваем? $\sqrt{N}$ ${N^2}$

Не должно быть формулой: $\sigma= \dfrac{ \sqrt{ \sum\limits_{i=1}^n (x_i-\mu)^2} } {N}$

standard-deviation Махеш Субрамания
источник

10

Вы пытаетесь найти «типичное» отклонение от среднего.

Дисперсия - это «среднеквадратичное расстояние от среднего».

Стандартное отклонение является квадратным корнем этого.

Это делает его среднеквадратичным отклонением от среднего.

Зачем нам использовать среднеквадратичное отклонение? Что делает дисперсию интересной? Помимо прочего, из-за основного факта о дисперсиях, что дисперсия суммы некоррелированных переменных является суммой отдельных дисперсий. (Это рассматривается в ряде вопросов, например, здесь, в CrossValidated. Эта удобная функция не разделяется, например, средним абсолютным отклонением.
Зачем брать квадратный корень из этого? Потому что тогда он в тех же единицах, что и исходные наблюдения. Он измеряет определенный тип «типичного расстояния» от среднего значения (как уже упоминалось, среднеквадратичное расстояние), но из-за вышеупомянутого свойства дисперсии, которое имеет некоторые приятные особенности.

Glen_b - Восстановить Монику
источник

7

Стандартное отклонение представляет собой квадратный корень из дисперсии .

Дисперсия - это среднее квадратическое расстояние данных от среднего. Поскольку среднее - это сумма, деленная на количество суммируемых элементов, формула для дисперсии: Так как стандартное отклонение, опять же, является просто квадратным корнем из этого, формула для стандартного отклонения: Ничего не было добавлено или изменено предположения или дисперсия здесь, мы просто взяли квадратный корень из дисперсии, потому что это то , что стандартное отклонение это .

Var (X) = E [(X - μ)^{2}] = \frac{\sum_{i = 1}^{N} (x_{i} - μ)^{2}}{N}

$\text{Var}(X)=\text{E}[(X-\mu)^2] = \frac{\sum_{i=1}^N(x_i-\mu)^2}{N}$

S.D. (X) = \sqrt{Var (X)} = \sqrt{\frac{\sum_{i = 1}^{N} (x_{i} - μ)^{2}}{N}}

$\text{S.D.}(X)=\sqrt{\text{Var}(X)} = \sqrt{\frac{\sum_{i=1}^N(x_i-\mu)^2}{N}}$

Gung - Восстановить Монику
источник

возможно, следует отметить, что эта формула дисперсии верна только для дискретных униформ. иначе это могло бы спутать различие между выборкой и дисперсией населения

Тейлор

@ Тейлор, я не знаю, что ты имеешь в виду. Формула для дисперсии не связана с распределением.

gung - Восстановить Монику

формула для (выборочной) дисперсии не связана с распределением ( en.wikipedia.org/wiki/Expected_value#Definition )

Тейлор,

@ Тейлор, я до сих пор не знаю, что ты имеешь в виду. Формула для дисперсии не связана с распределением. Процитируем со страницы Википедии: «Дисперсия случайной величины X является ожидаемым значением квадрата отклонения от среднего значения X ... . Это определение включает в себя случайные переменные, которые генерируются дискретными, непрерывными, либо смешанными процессами ». Формула верна не только для дискретной униформы.

Var (X) = E [(X - μ)^{2}]

$\operatorname{Var}( X ) = E⁡[(X − μ)^2]$

gung - Восстановить Монику

Да, правильно, если вы берете , но не обязательно равно для любой случайной величины , . С одной стороны, первая является константой, а вторая - случайной. На самом деле не ясно, превышает ли сумма поддержку или количество выборок. Если последнее, то странно, что вы знаете , что редко встречается на практике. Если первое, то да, это верно только для дискретных (потому что это сумма) униформ (потому что все веса одинаковы).

μ = E X

$\mu = EX$

E [(X - μ)^{2}]

$E[(X-\mu)^2]$

X

$X$

\frac{1}{N} \sum_{i} (x_{i} - μ)^{2}

$\frac{1}{N}\sum_i(x_i - \mu)^2$

X

$X$

μ

$\mu$

Тейлор

1

Первое, что нужно понять, это то, что стандартное отклонение (стандартное отклонение) отличается от среднего абсолютного отклонения . Эти два определяют разные математические свойства данных.

В отличие от среднего абсолютного отклонения, стандартное отклонение (стандартное отклонение) весит больше значений, которые далеки от среднего, что достигается путем возведения в квадрат значений разности.

Например, для следующих четырех точек данных:

\begin{array}{ccc} D a t a (x) & | x - m e a n | & (x - m e a n)^{2} \\ 2 & 2 & 4 \\ - 2 & 2 & 4 \\ - 6 & 6 & 36 \\ 6 & 6 & 36 \\ \sum x = 0 & \sum (| x - m e a n |) = 16 & \sum (x - m e a n)^{2} = 80 \end{array}

$\begin{array}{|c|c|c|} \hline Data (x)& |x - mean| & (x-mean)^2 \\ \hline 2 & 2 & 4\\ \hline -2 &2 &4\\ \hline -6 &6 &36\\ \hline 6 &6 &36\\ \hline \sum x =0 & \sum (|x-mean|) = 16 & \sum (x-mean)^2 = 80 \end{array}$

среднее абсолютное отклонение (aad) и $= 16/4 = 4.0$

Стандартное отклонение (стандартное отклонение) = $\sqrt{80/4} = \sqrt 20 = 4.47$

В данных есть две точки, которые находятся на расстоянии 6 от среднего значения, и две точки, которые находятся на расстоянии 2 от среднего значения. Таким образом, отклонение 4,47 имеет больше смысла, чем 4.

Поскольку общее наблюдение всегда , для вычисления стандартного отклонения мы не погружаемся на , вместо этого мы делим общую дисперсию на и берем ее квадратный корень, чтобы привести ее к той же единице, что и исходные данные. $N$ $\sqrt N$ $N$

aumpen
источник

0

@Mahesh Subramaniya - это просто математический поворот . Когда у нас есть первоначальное значение, например, . Мы можем получить одно и то же значение, используя эти два уравнения и . $a/b = (-)d$ ${a}^2\diagup{b}=c$ $\sqrt{c\diagup{b}}=d$

Например, просто сделайте это с = . Но мы хотим только ценность, а не минус. ${-5}\diagup{2}$ $-2.5$

Теперь . И ${-5}^2\diagup{2}=12.5$ $\sqrt{12.5\diagup{2}}=2.5$

Ellephy
источник

Почему квадратный корень взят для выборки «N» в формуле стандартного отклонения?

Ответы: