Связь между дисперсией и попарными расстояниями в переменной

20

Пожалуйста, докажите, что если у нас есть две переменные (одинаковый размер выборки) и а дисперсия в больше, чем в , то сумма квадратов разностей (то есть квадратов евклидовых расстояний) между точками данных в также больше, чем что в .XYXYXY

ttnphns
источник
1
Пожалуйста, уточните: когда вы говорите « дисперсия» , вы имеете в виду выборочную дисперсию ? Когда вы говорите сумму квадратов разностей , вы имеете в виду ? i,j(xixj)2
кардинал
9
Если предположить , что сказанное выше: тщательно учтя элементы в перекрестном сроке. Я полагаю, вы можете заполнить (небольшие пробелы). Результат тогда следует тривиально.
i,j(xixj)2=ij((xix¯)(xjx¯))2=2ni=1n(xix¯)2,
кардинал
2
Существует также способ сделать это «без» какого-либо вычисления, учитывая тот факт, что если и X 2 определены из F (с четко определенной дисперсией), то E ( X 1 - X 2 ) 2 = 2 V а г ( х 1 ) . Тем не менее, это требует более жесткого понимания вероятностных концепций. X1X2FE(X1X2)2=2Var(X1)
кардинал
1
Для связанного вопроса я использовал визуализацию того, что происходит здесь, в ответе на stats.stackexchange.com/a/18200 : квадратные различия - это площади квадратов.
whuber
1
@whuber: Очень мило. Как-то я пропустил этот твой ответ по пути.
кардинал

Ответы:

5

Просто, чтобы предоставить «официальный» ответ, чтобы дополнить решения, набросанные в комментариях, обратите внимание

  1. Ни одно из , Var ( ( Y i ) ) , i , j ( X i - X j ) 2 или i , j ( Y i - Y j ) 2 не изменяется путем сдвига всех X я равномерно к X i - μ для некоторой постоянной μ или сдвигая все YVar((Xi))Var((Yi))i,j(XiXj)2i,j(YiYj)2XiXiμμ к Y i - ν для некоторой постоянной ν . Таким образоммы можем предположитьтакие сдвиги были выполненычтобы сделать Е X я = Е Y я = 0 , откуда Var ( ( X я ) ) = Σ X 2 я и Var ( ( Y я ) ) = Е Y 2 я .YiYiννXi=Yi=0Var((Xi))=Xi2Var((Yi))=Yi2

  2. После устранения общих факторов с каждой стороны и использования (1) вопрос требует показать, что подразумевает i , j ( X i - X j ) 2i , j ( Y i - Y j ) 2 .Xi2Yi2i,j(XiXj)2i,j(YiYj)2

  3. Простое разложение квадратов и перестановка сумм дают с подобным результатом для Y «с.

    i,j(XiXj)2=2Xi22(Xi)(Xj)=2Xi2=2Var((Xi))
    Y

Доказательство немедленно.

Whuber
источник