Что такое коррекция смещения? [закрыто]

12

Я видел много мест, где у них есть наборы данных ввода / вывода, где они сначала создают линию линейной регрессии, исправляют смещение, а затем используют эти данные только для своей модели. Я не понял, что это за коррекция смещения?

user31820
источник
6
Я думаю, что вам, возможно, потребуется предоставить ссылку или явный пример, чтобы мы могли точно знать, на что именно вы реагируете.
whuber
@ naught101, делайте несколько раз за раз, не спамите на главной странице.
gung - Восстановить Монику
@ Gung: ах ... ты имеешь в виду пометить несколько, а затем немного подождать? Извините слишком поздно. Я нашел только 10 или около того, и я сделал их все. Забыл про эффект первой страницы: / Если бы только у SE была хорошая функция массовой пометки.
naught101
@ Gung: Может быть, сегодня может быть первый день исправления предвзятости: D
naught101
1
@ naught101 односторонняя массовая повторная маркировка - это что-то вроде «нет-нет», особенно для тега, который вы только что сделали. В общих чертах, лучше всего использовать мета, где это возможно (чтобы объяснить, что вы намерены), и, если это кажется неоспоримым, сделать несколько повторных пометок, но только несколько раз за раз.
Glen_b

Ответы:

11

Хотя формулировка проблемы не является достаточно точной, чтобы точно знать, к какому типу коррекции смещения вы обращаетесь, я думаю, что могу говорить об этом в общем виде. Иногда оценка может быть предвзятой. Это просто означает, что, хотя он может быть хорошим оценщиком, его ожидаемое или среднее значение не совсем равно параметру. Разница между средним значением оценки и истинным значением параметра называется смещением. Когда известно, что оценщик смещен, иногда можно с помощью других средств оценить смещение, а затем изменить оценщик путем вычитания оценочного смещения из исходной оценки. Эта процедура называется коррекцией смещения. Это делается с целью улучшения оценки. Хотя это уменьшит смещение, оно также увеличит дисперсию.

Хорошим примером успешной коррекции смещения являются начальные оценки коррекции смещения коэффициента ошибок классификации. Оценка повторного замещения частоты ошибок имеет большой оптимистический уклон при небольшом размере выборки. Начальная загрузка используется для оценки смещения оценки повторного замещения, и, поскольку оценка повторного замещения недооценивает частоту ошибок, оценка смещения добавляется к оценке повторного замещения для получения скорректированной оценки начальной ошибки смещения ошибки. Когда размер выборки не превышает 30 или менее, объединяя оба класса в задаче о двух классах, определенные формы оценки начальной загрузки (в частности, оценка 632) обеспечивают более точные оценки частоты ошибок, чем перекрестная проверка с пропуском (что очень почти непредвзятая оценка частоты ошибок).

Майкл Р. Черник
источник
1
«Хотя это уменьшит смещение, оно также увеличит дисперсию». - Вы можете объяснить это немного больше? Разве это не зависит от метода? Вы в основном имеете в виду, что уменьшение смещения RMSE-оптимальной линейной регрессии обязательно увеличит RMSE, или это что-то еще?
naught101