Я пытался установить неравенство
где - среднее значение выборки, а - стандартное отклонение выборки, то есть S = \ sqrt {\ frac {\ sum_ {i = 1} ^ n \ left (X_i - \ bar {X} \ right) ^ 2} {n-1}} .
Легко видеть, что и так но это не очень близко к тому, что я искал, и не является полезным ограничением. Я экспериментировал с неравенствами Коши-Шварца и неравенства треугольника, но никуда не делся. Там должен быть тонкий шаг, который я где-то упускаю. Буду признателен за помощь, спасибо.
После упрощения проблемы с помощью рутинных процедур ее можно решить, превратив ее в программу двойной минимизации, которая имеет хорошо известный ответ с элементарным доказательством. Возможно, эта дуализация является «тонким шагом», о котором идет речь в вопросе. Неравенство также можно установить чисто механическим путем, максимизируячерез множители Лагранжа.| Tя|
Во-первых, я предлагаю более элегантное решение, основанное на геометрии наименьших квадратов. Это не требует предварительного упрощения и является почти немедленным, обеспечивая непосредственную интуицию в результате. Как предполагается в вопросе, проблема сводится к неравенству Коши-Шварца.
Геометрическое решение
Рассмотрим как мерный вектор в евклидовом пространстве с обычным точечным произведением. Пусть стать базисный вектор и . Запишите и для ортогональных проекций и в ортогональное дополнение к . (В статистической терминологии они являются остатками относительно средних.) Тогда, поскольку ип у = ( 0 , 0 , ... , 0 , 1 , 0 , ... , 0 ) я й 1 = ( 1 , 1 , ... , 1 ) х у х у 1 Х я - ˉ Х =х =( х1, X2, … , XN) N y =(0,0,…,0,1,0,…,0) яго 1 =(1,1,…,1) Икс^ Y^ Икс Y 1 S=| | х | | /√Икся- Х¯= х^⋅ у S= | | Икс^||/n−1−−−−−√ ,
является компонентом в направлении . По Коши-Шварцу, это максимизируется именно тогда, когда параллелен , для которого QED. х х у =(-1,-1,...,-1,п-1,-1,-1,...,-1)/пТя=plusmn√Y^ Икс^ Икс^ Y^= ( - 1 , - 1 , … , - 1 , n - 1 , - 1 , - 1 , … , - 1 ) / n
Кстати, это решение обеспечивает исчерпывающую характеристику всех случаев, когдамаксимально: они все в форме| Tя|
для всех настоящих .μ , σ
Этот анализ легко обобщается на случай, когда заменяется любым набором регрессоров. Очевидно, максимум пропорционален длине невязки ,,T i y | | у | |{ 1 } Tя Y | | Y^| |
упрощение
Поскольку является инвариантным при изменениях местоположения и масштаба, мы можем предположить без ограничения общности, что сумма равна нулю, а их квадраты - . Это идентифицируетс, поскольку (средний квадрат) равен . Максимизация его равносильна максимизации . Принимая , общность также не теряется , поскольку являются взаимозаменяемыми.X i n - 1 | Т я | | X я | S 1 | Т я | 2 = T 2 i = X 2 i i = 1 X iTя Икся n - 1 | Tя| | Икся| S 1 | Tя|2= Т2я= Х2я я = 1 Икся
Решение с помощью двойного состава
Двойственная проблема состоит в том, чтобы зафиксировать значение и спросить, какие значения оставшихся необходимы, чтобы минимизировать сумму квадратов учитывая, что . Поскольку задано , это проблема минимизации учитывая, что . Х J , J ≠ 1 Σ п J = 1 X 2 J Σ п J = 1 Х J = 0 X 1 Σ п J = 2 X 2 J Σ п J = 2 Х J = - Х 1Икс21 ИксJ, j ≠ 1 ΣNJ = 1Икс2J ΣNJ = 1ИксJ= 0 Икс1 ΣNJ = 2Икс2J ΣNJ = 2ИксJ= - X1
Решение легко найти во многих отношениях. Одним из самых элементарных является написать
для которого . Расширение целевой функции и использование этой суммы к нулю, чтобы упростить ее, производитΣNJ = 2εJ= 0
немедленно показывая уникальное решение для всех . Для этого решенияjεJ= 0 J
а также
КЕД .
Решение с помощью машин
Вернемся к упрощенной программе, с которой мы начали:
при условии
Метод множителей Лагранжа (который является почти чисто механическим и простым) приравнивает нетривиальную линейную комбинацию градиентов этих трех функций к нулю:
Компонент за компонентом, эти уравненийN
Последние из них подразумевают либо либо . (Мы можем исключить последний случай, потому что тогда первое уравнение подразумевает , тривиализируя линейную комбинацию.) Ограничение суммы до нуля дает . Ограничение суммы квадратов дает два решенияn - 1 Икс2= Х3= ⋯ = XN= - λ2/ (2 λ3) λ2= λ3= 0 λ1= 0 Икс1= - ( n - 1 ) X2
Они оба дают
источник
Неравенство, как указано, верно. Интуитивно понятно, что мы получаем наиболее сложный случай для неравенства (то есть максимизации левой стороны для заданного ), выбирая одно значение, скажем, как можно больше, при этом все остальные равны. Давайте посмотрим на пример с такой конфигурацией:S2 Икс1
РЕДАКТИРОВАТЬ
Теперь мы докажем претензию, как указано выше. Во-первых, для любого данного вектора в этой задаче мы можем заменить его на не меняя ни одну из сторон вышеприведенного неравенства. Итак, в дальнейшем предположим, что . Мы также можем с помощью перемаркировки предположить, что является наибольшим. Затем, выбрав сначала а затем мы можем проверить с помощью простой алгебры, что мы имеем равенство в заявленном неравенстве. Итак, это остро.х = ( х1, х2, … , ХN) х - х¯ Икс¯= 0 Икс1 Икс1> 0 Икс2= х3= ⋯ = xN= - х1n - 1
Затем определите (выпуклую) область помощью для данной положительной константы . Обратите внимание, что - это пересечение гиперплоскости с сферой, центрированной в начале координат, так же как и сфера в -пространстве. Теперь наша проблема может быть сформулирована как ср
источник