Я пытаюсь понять компромисс между отклонением оценки, отношением между отклонением оценки и отклонением модели, а также отношением между дисперсией оценки и дисперсией модели.
Я пришел к этим выводам:
- Мы склонны переписывать данные, когда пренебрегаем смещением оценки, то есть когда мы стремимся минимизировать смещение модели, пренебрегая дисперсией модели (другими словами, мы стремимся минимизировать дисперсию оценки без учета уклон оценщика тоже)
- И наоборот, мы склонны занижать данные, когда пренебрегаем дисперсией оценки, то есть когда мы стремимся минимизировать дисперсию модели, пренебрегая смещением модели (другими словами, мы стремимся минимизировать смещение оценка без учета дисперсии оценки тоже).
Верны ли мои выводы?
Ответы:
Ну вроде. Как уже говорилось, вы приписываете намерение ученому минимизировать отклонения или отклонения. На практике вы не можете явно наблюдать смещение или дисперсию вашей модели (если бы вы могли, тогда вы бы знали истинный сигнал, и в этом случае вам не понадобится модель). В общем, вы можете наблюдать частоту ошибок вашей модели только на конкретном наборе данных, и вы пытаетесь оценить частоту ошибок вне выборки, используя различные творческие приемы.
Теперь вы действительно знаете , что, по крайней мере теоретически, эта частота ошибок может быть разложена на смещение и дисперсии точку, но вы не можете непосредственно наблюдать этот баланс в любой ситуации конкретного бетона. Поэтому я бы немного переформулировал ваши наблюдения как:
В общем, нет реального способа узнать наверняка, так как вы никогда не сможете по-настоящему наблюдать смещение модели. Тем не менее, существуют различные модели поведения, которые указывают на то, что они находятся в той или иной ситуации:
Это модели, которые проявляются на известных графиках коэффициентов ошибок по сложности модели, этот пример взят из «Элемента статистического обучения»:
Часто эти графики перекрываются кривой смещения и дисперсии. Я взял это из этой хорошей экспозиции :
Но очень важно понимать, что вы никогда не увидите эти дополнительные кривые в любой реалистичной ситуации.
источник
Иллюстрирование смещения
Как отмечает @Matthew Drury, в реалистичных ситуациях вы не видите последний график, но следующий игрушечный пример может предоставить визуальную интерпретацию и интуицию тем, кто считает его полезным.
Набор данных и предположения
Подгонка различных моделей полиномов
Интуитивно понятно, что прямая кривая будет работать плохо, поскольку набор данных явно нелинейный. Аналогично, подгонка полинома очень высокого порядка может быть чрезмерной. Эта интуиция отражена на графике ниже, который показывает различные модели и соответствующие им среднеквадратичные ошибки для данных о поездах и испытаниях.
Приведенный выше график работает для отдельного разделения поезда / теста, но как мы узнаем, обобщает ли он?
Оценка ожидаемого поезда и теста MSE
Здесь у нас много вариантов, но один из подходов состоит в том, чтобы случайным образом разделить данные между поездом / тестом - подогнать модель к заданному разделению и повторить этот эксперимент много раз. Результирующее MSE может быть нанесено на график, и среднее значение является оценкой ожидаемой ошибки.
Интересно видеть, что тест MSE сильно колеблется для разных разделений данных поезда / теста. Но взятие среднего значения для достаточно большого количества экспериментов дает нам большую уверенность.
Уклон - Разница Разложение
Как объяснено здесь, MSE можно разбить на 3 основных компонента:
Где в нашем игрушечном чехле:
Давая следующее соотношение
Примечание: приведенный выше график использует данные обучения для подбора модели, а затем вычисляет MSE на тренировке + тест .
источник