Пожалуйста, докажите, что если у нас есть две переменные (одинаковый размер выборки) и а дисперсия в больше, чем в , то сумма квадратов разностей (то есть квадратов евклидовых расстояний) между точками данных в также больше, чем что в .
20
Ответы:
Просто, чтобы предоставить «официальный» ответ, чтобы дополнить решения, набросанные в комментариях, обратите внимание
Ни одно из , Var ( ( Y i ) ) , ∑ i , j ( X i - X j ) 2 или ∑ i , j ( Y i - Y j ) 2 не изменяется путем сдвига всех X я равномерно к X i - μ для некоторой постоянной μ или сдвигая все YVar((Xi)) Var((Yi)) ∑i,j(Xi−Xj)2 ∑i,j(Yi−Yj)2 Xi Xi−μ μ к Y i - ν для некоторой постоянной ν . Таким образоммы можем предположитьтакие сдвиги были выполненычтобы сделать Е X я = Е Y я = 0 , откуда Var ( ( X я ) ) = Σ X 2 я и Var ( ( Y я ) ) = Е Y 2 я .Yi Yi−ν ν ∑Xi=∑Yi=0 Var((Xi))=∑X2i Var((Yi))=∑Y2i
После устранения общих факторов с каждой стороны и использования (1) вопрос требует показать, что подразумевает ∑ i , j ( X i - X j ) 2 ≥ ∑ i , j ( Y i - Y j ) 2 .∑X2i≥∑Y2i ∑i,j(Xi−Xj)2≥∑i,j(Yi−Yj)2
Простое разложение квадратов и перестановка сумм дают с подобным результатом для Y «с.
Доказательство немедленно.
источник