Мне было интересно, какова разница между дисперсией и стандартным отклонением.
Если вы рассчитываете два значения, становится ясно, что вы получаете стандартное отклонение от дисперсии, но что это означает с точки зрения распределения, которое вы наблюдаете?
Кроме того, зачем вам стандартное отклонение?
Ответы:
Стандартное отклонение - это квадратный корень из дисперсии.
Стандартное отклонение выражается в тех же единицах, что и среднее значение, тогда как дисперсия выражается в квадратах, но для просмотра распределения вы можете использовать любой из них, если вы точно знаете, что используете. Например, нормальное распределение со средним значением = 10 и sd = 3 - это то же самое, что нормальное распределение со средним значением = 10 и дисперсией = 9.
источник
Вам не нужны оба. У каждого из них разные цели. SD обычно более полезен для описания изменчивости данных, в то время как дисперсия обычно намного полезнее математически. Например, сумма некоррелированных распределений (случайных величин) также имеет дисперсию, которая является суммой дисперсий этих распределений. Это не было бы верно для SD. С другой стороны, SD имеет удобство выражаться в единицах исходной переменной.
источник
Если Джон ссылается на независимые случайные величины, когда говорит «несвязанные распределения», то его ответ правильный. Однако, чтобы ответить на ваш вопрос, есть несколько моментов, которые можно добавить:
Среднее значение и дисперсия являются двумя параметрами, которые определяют нормальное распределение.
Погрешность выражается в виде кратного стандартного отклонения оценки.
Дисперсия и смещение являются мерами неопределенности в случайной величине. Среднеквадратичная ошибка для оценки равна дисперсии + квадратное смещение.
источник
Дисперсия набора данных измеряет математическую дисперсию данных относительно среднего значения. Однако, хотя это значение теоретически правильно, его трудно применить в реальном смысле, потому что значения, использованные для его вычисления, были возведены в квадрат. Стандартное отклонение, поскольку квадратный корень из дисперсии дает значение в тех же единицах, что и исходные значения, что значительно упрощает работу и интерпретацию в сочетании с концепцией нормальной кривой.
источник
С точки зрения распределения они эквивалентны (но, очевидно, не являются взаимозаменяемыми), но имейте в виду, что с точки зрения оценок это не так: квадратный корень оценки дисперсии НЕ является (несмещенной) оценкой стандартного отклонения. Только для умеренно большого количества выборок (и в зависимости от оценщиков) эти два сближаются. Для небольших размеров выборки вам необходимо знать параметрическую форму распределения для преобразования между ними, которая может стать слегка круглой.
источник
При расчете дисперсии мы возводили в квадрат отклонения. Это означает, что если данные (наблюдения) приведены в метрах, они станут квадратными метрами. Надеюсь, это не правильное представление об отклонениях. Итак, мы снова квадратный корень (SD), который является ничем иным, как SD.
источник