При изучении двух независимых выборочных средств нам говорят, что мы смотрим на «разницу двух средних». Это означает, что мы берем среднее значение из совокупности 1 ( ) и вычитаем из него среднее значение из совокупности 2 ( ). Итак, наша «разница двух средних» есть ( \ bar y_1 - \ bar y_2 ). ˉ у 2 ˉ у 2
При изучении парных выборочных средств нам говорят, что мы смотрим на «среднее различие», . Это рассчитывается по разности между каждой парой, а затем по среднему значению всех этих различий.
Мой вопрос: получаем ли мы то же самое ( - ) по сравнению с его если мы вычислили их по двум столбцам данных, и в первый раз посчитал, что это две независимые выборки, а во второй раз - в паре данные? Я поиграл с двумя столбцами данных, и кажется, что значения одинаковы! В таком случае, можно ли сказать, что разные имена используются только по неколичественным причинам?
источник
Ответы:
(Я предполагаю, что вы имеете в виду «образец», а не «население» в первом абзаце.)
Эквивалентность легко показать математически. Начните с двух образцов одинакового размера: и . Затем определите{ y 1 , … , y n } ˉ x{x1,…,xn} {y1,…,yn}
Тогда у вас есть:
источник
Распределение среднего значения должно быть более жестким, чем распределение среднего значения. Посмотрите на это на простом примере: среднее значение в образце 1: 1 10 100 1000, среднее значение в образце 2: 2 11 102 1000, разность средних составляет 1 1 2 0 (в отличие от самих образцов) имеет малое стандартное отклонение.
источник