- Средняя квадратическая ошибка
- остаточная сумма квадратов
- остаточная стандартная ошибка
- средняя квадратическая ошибка
- ошибка теста
Я думал, что привык понимать эти термины, но чем больше я сталкиваюсь со статистическими проблемами, тем больше я запутываюсь в том, что я сам себя угадаю. Я хотел бы получить подтверждение и конкретный пример
Я могу найти уравнения достаточно легко в Интернете, но у меня возникают проблемы с объяснением этих терминов «объясни мне, как будто мне 5 лет», так что я могу кристаллизовать в голове различия и то, как одно ведет к другому.
Если кто-нибудь может взять этот код ниже и указать, как я буду рассчитывать каждый из этих терминов, я был бы признателен. R код был бы отличным ..
Используя этот пример ниже:
summary(lm(mpg~hp, data=mtcars))
Покажите мне в коде R, как найти:
rmse = ____
rss = ____
residual_standard_error = ______ # i know its there but need understanding
mean_squared_error = _______
test_error = ________
Бонусные баллы за объяснение, как я 5 различий / сходств между ними. пример:
rmse = squareroot(mss)
r
regression
residuals
user3788557
источник
источник
Ответы:
В соответствии с просьбой я иллюстрирую использование простой регрессии с использованием
mtcars
данных:Среднеквадратичная ошибка (MSE) является средним значением квадрата невязки:
Среднеквадратическая ошибка (RMSE) - это квадратный корень из MSE:
Остаточная сумма квадратов (RSS) является суммой квадратов невязок:
Остаточная стандартная ошибка (RSE) - это квадратный корень из (RSS / степени свободы):
Тот же расчет упрощен, потому что мы предварительно рассчитали
rss
:Термин « ошибка теста» в контексте регрессии (и других методов прогнозной аналитики) обычно относится к вычислению статистики теста по данным теста, отличным от ваших данных обучения.
Другими словами, вы оцениваете модель, используя часть ваших данных (часто 80% выборки), а затем вычисляете ошибку, используя выборочную выборку. Опять же, я иллюстрирую использование
mtcars
, на этот раз с 80% выборкиОцените модель, затем сделайте прогноз с помощью данных об удержании:
Объединить исходные данные и прогноз в кадре данных
Теперь вычислите статистику теста обычным способом. Я иллюстрирую MSE и RMSE:
Обратите внимание, что этот ответ игнорирует взвешивание наблюдений.
источник
Оригинальный плакат попросил ответить «объясни мне как 5». Допустим, ваш школьный учитель приглашает вас и ваших одноклассников помочь угадать ширину стола учителя. Каждый из 20 учеников в классе может выбрать устройство (линейку, шкалу, ленту или критерий) и может измерить таблицу 10 раз. Вас всех просят использовать разные начальные местоположения на устройстве, чтобы не читать одно и то же число снова и снова; затем начальное чтение должно быть вычтено из конечного значения, чтобы в итоге получить одно измерение ширины (вы недавно узнали, как выполнять этот тип математики).
Всего было проведено 200 измерений ширины (20 учеников, по 10 измерений в каждом). Наблюдения передаются учителю, который будет анализировать числа. Вычитание наблюдений каждого учащегося из контрольного значения приведет к еще 200 числам, которые называются отклонениями . Средние учителя образец каждого студента в отдельности, получение 20 средств . Вычитание наблюдений каждого учащегося из их индивидуального среднего значения приведет к 200 отклонениям от среднего значения, которые называются невязками . Если бы средний остаток был рассчитан для каждой выборки, вы бы заметили, что он всегда равен нулю. Если вместо этого мы возведем в квадрат каждый остаток, усредним их и, наконец, отменим квадрат, мы получим стандартное отклонение, (Кстати, мы называем этот последний расчетный бит квадратным корнем (подумайте о нахождении основания или стороны данного квадрата), поэтому для краткости всю операцию часто называют среднеквадратичным ; стандартное отклонение наблюдений равно среднеквадратичное значение остатков.)
Но учитель уже знал истинную ширину стола, основываясь на том, как он был спроектирован, изготовлен и проверен на заводе. Таким образом, еще 200 чисел, называемых ошибками , могут быть рассчитаны как отклонение наблюдений относительно истинной ширины. Средняя ошибка может быть вычислена для каждого студента образца. Аналогично, для наблюдений можно рассчитать стандартное отклонение ошибки или стандартную ошибку . Больше 20 среднеквадратичная ошибказначения также могут быть рассчитаны. Три набора из 20 значений соотносятся как sqrt (me ^ 2 + se ^ 2) = rmse, в порядке появления. На основании rmse учитель может судить, чей ученик предоставил наилучшую оценку ширины стола. Кроме того, рассматривая отдельно 20 средних ошибок и 20 стандартных значений ошибок, учитель может проинструктировать каждого ученика, как улучшить свои чтения.
В качестве проверки учитель вычитал каждую ошибку из соответствующей средней ошибки, в результате чего получилось еще 200 чисел, которые мы назовем остаточными ошибками (что не часто делается). Как и выше, средняя остаточная ошибка равна нулю, поэтому стандартное отклонение остаточных ошибок или стандартная остаточная ошибка совпадает со стандартной ошибкой , и на самом деле то же самое относится и к среднеквадратичной остаточной ошибке . (Подробнее см. Ниже.)
Теперь вот что-то интересное для учителя. Мы можем сравнить каждое среднее значение ученика с остальной частью класса (всего 20 означает). Так же, как мы определили до этих значений точек:
мы также можем определить сейчас:
Только если класс студентов называется беспристрастным, т. Е. Если mem = 0, то sem = sm = rmsem; т. е. стандартная ошибка среднего значения, стандартное отклонение среднего значения и среднеквадратичная ошибка среднего значения могут быть одинаковыми при условии, что средняя ошибка среднего равна нулю.
Если бы мы взяли только одну выборку, т. Е. Если в классе был только один студент, стандартное отклонение наблюдений можно использовать для оценки стандартного отклонения среднего значения (см), как sm ^ 2 ~ s ^ 2 / n, где n = 10 - размер выборки (количество чтений на одного учащегося). Эти два лучше согласятся с ростом размера выборки (n = 10,11, ...; больше чтений на одного учащегося) и увеличением числа образцов (n '= 20,21, ...; больше учеников в классе). (Предостережение: неквалифицированная «стандартная ошибка» чаще относится к стандартной ошибке среднего значения, а не к стандартной ошибке наблюдений.)
Вот некоторые детали расчетов. Истинное значение обозначено т.
Операции с заданными точками:
ВНУТРЕННИЕ ОБРАЗЦЫ НАБОРОВ:
ВНУТРЕННИЕ ОБРАЗЦЫ (см. Таблицу 1):
МНОЖЕСТВЕННЫЕ (АНСАМБЛЬНЫЕ) НАБОРЫ:
МЕЖПРОВОДНЫЕ (АНСАМБЛЬНЫЕ) ТОЧКИ (см. Таблицу 2):
источник
Я также чувствую, что все термины очень запутанные. Я чувствую, что необходимо объяснить, почему у нас так много метрик.
Вот моя заметка о SSE и RMSE:
Первый показатель: сумма квадратов ошибок (SSE). Другие названия, Остаточная сумма квадратов (RSS), Сумма квадратов невязок (SSR).
Если мы находимся в сообществе оптимизации, SSE широко используется. Это потому, что это цель в оптимизации, где оптимизация
И остаточный / ошибка термине = хβ- у , а также ∥ е ∥2= еTе , который называется Sum of Squared Errors (SSE).
Вторая метрика: среднеквадратичная ошибка (RMSE) . Другие названия, среднеквадратичное отклонение.
RMSE является
гдеN количество точек данных
Вот почему у нас есть этот показатель в дополнение к SSE, о котором мы говорили выше. Преимущество RMSE метрики в том, что она более «нормализована». В частности, SSE будет зависеть от объема данных. MSE не будет зависеть от объема данных, но RMSE также выражает ошибку в тех же единицах, что иY ,
источник