Разве в стандартизации дисперсия известна, а в студенчестве она неизвестна и поэтому оценивается? Спасибо.
standardization
58485362
источник
источник
Ответы:
Краткий обзор. Учитывая модель , где Х представляет п × р , β = ( Х ' х ) - 1 х ' у и у = X & beta ; = Х ( X ' X ) - 1 X ' Y = H y , где H = X ( X ′ Xy=Xβ+ε X n×p β^=(X′X)- 1Икс'Y Y^= Xβ^знак равноX( X'Икс)- 1Икс'Yзнак равно HY - «шляпная матрица». Невязки
е = у - у = у - Н у = ( I - Н ) у
Дисперсия населения σ 2 неизвестна и может быть оцененапомощью M S E , среднеквадратической ошибки.ЧАСзнак равноX( X'Икс)- 1Икс'
Полуудуентифицированные остатки определяются как , но, так как дисперсия остатков зависит откаксг2иX, их оценка дисперсии является:
Стандартизированные остатки, также называемые внутренне учтенными остатками :
Однако отдельные и M S E не являются независимыми, поэтомуея MSЕ не могу иметь т распределения. Процедура затем удалить I - го наблюдения, установите функцию регрессии для остальных п - 1 наблюдений, аполучить новые Y «Sкоторый может быть обозначенря T я n - 1 Y^ . Разница:
дя=уя - у я(я)
называетсяY^я ( я )
См. Катнер и др., Прикладные линейные статистические модели , глава 10.
Изменить: я должен сказать, что ответ по rpierce является идеальным. Я думал, что ОП был о стандартизированных и изученных остатках (и деление на стандартное отклонение популяции для получения стандартизированных остатков выглядело странно для меня, конечно), но я ошибался. Я надеюсь, что мой ответ может помочь кому-то, даже если ОТ.
источник
Тем не менее, похоже, что есть некоторые терминологические различия между полями (см. Комментарии к этому ответу). Следовательно, следует соблюдать осторожность при проведении этих различий. Более того, оцененные оценки редко называют таковыми, и обычно можно увидеть «изученные» значения в контексте регрессии. @Sergio предоставляет подробности об этих типах удаленных остатков в своем ответе.
источник
Я очень поздно отвечаю на этот вопрос !! Но не смог найти ответ на очень простом языке, поэтому скромная попытка ответить на это.
Почему мы занимаемся стандартизацией? Представьте, что у вас есть две модели: одна предсказывает сумасшествие из количества времени, потраченного на изучение статистики, в то время как другая предсказывает лог (сумасшествие) с количеством времени на статистику.
было бы трудно понять, что остатки находятся в разных единицах. Таким образом, мы стандартизируем их (аналогично теории Z-счета)
Стандартизированные остатки: - Когда остатки делятся на оценку стандартного отклонения. В общем, если абсолютное значение> 3, то это вызывает беспокойство.
Мы используем это, чтобы исследовать выбросы в модели.
Studentized Residual: мы используем это для изучения устойчивости модели.
Процесс прост. Мы удаляем отдельный тестовый пример из модели и выясняем новое прогнозируемое значение. Разница между новым значением и исходным наблюдаемым значением может быть стандартизирована путем деления стандартной ошибки. это значение является остаточным
Для получения дополнительной информации об обнаружении статики с помощью R - http://www.statisticshell.com/html/dsur.html
источник
Википедия имеет хороший обзор по адресу https://en.wikipedia.org/wiki/Normalization_(statistics). :
Студенческая т-статистикаИкс- Х¯¯¯¯¯s
источник