Предположим, у меня есть 2 комплекта:
Набор A : количество элементов , ,
Набор B : количество элементов , ,
Я могу легко найти комбинированное среднее ( ), но как мне найти комбинированное стандартное отклонение?
Предположим, у меня есть 2 комплекта:
Набор A : количество элементов , ,
Набор B : количество элементов , ,
Я могу легко найти комбинированное среднее ( ), но как мне найти комбинированное стандартное отклонение?
Ответы:
Итак, если вы просто хотите объединить два из этих образцов в один:
где и - примерные значения, а и - типовые стандартные отклонения.y¯1 y¯2 s1 s2
Чтобы добавить их у вас есть:
что не так просто, так как новое среднее значение отличается от и :y¯ y¯1 y¯2
Окончательная формула:
Для обычно используемой версии стандартного отклонения с поправкой по Бесселю (" denominator") результаты для средних значений такие же, как и раньше, ноn−1
Вы можете прочитать больше информации здесь: http://en.wikipedia.org/wiki/Standard_deviation
источник
Это очевидно распространяется на групп:K
источник
У меня была та же проблема: имея стандартное отклонение, средние и размеры нескольких подмножеств с пустым пересечением, вычислим стандартное отклонение объединения этих подмножеств.
Мне нравится ответ sashkello и Glen_b ♦ , но я хотел найти подтверждение этому. Я сделал это таким образом, и я оставляю это здесь на случай, если это кому-нибудь поможет.
Таким образом, цель состоит в том, чтобы увидеть, что действительно:
Шаг за шагом:
Теперь уловка состоит в том, чтобы понять, что мы можем изменить порядок сумм: поскольку каждый термин появляется раз, мы можем написать числитель как
и, следовательно, продолжая цепочку равенства:
Это было сказано, вероятно, есть более простой способ сделать это.
Формула может быть расширена до подмножеств, как указано ранее. Доказательством будет индукция по числу множеств. Базовый случай уже доказан, и для этапа индукции вы должны применить аналогичную цепочку равенства к последнему.k
источник
s
из стандартных отклонений, средних и размеров двух подмножеств. В формуле нет ссылки на отдельные наблюдения. В доказательстве есть, но это только доказательство, и, с моей точки зрения, правильное.