Я оцениваю физическую модель и хотел бы знать, какой из методов мне следует использовать здесь (между RMSE и Коэффициент определения R2)
Проблема заключается в следующем: у меня есть функция, которая выводит прогнозы для входного значения x, . У меня также есть фактическое наблюдение для этого значения, которое я называю .yx
Мой вопрос в том, каковы плюсы и минусы RMSE или . Я видел, как их обоих использовали в документах для решения проблемы, над которой я работаю.
This value shows how well future outcomes can be predicted by the model
- это чрезвычайно вводит в заблуждение и склоняется к просто неправильному . Нет гарантии, что высокий коэффициент детерминации в данной модели зависит от того, насколько хорошо будут предсказаны будущие результаты.Независимо от того, какую ошибку вы даете, рассмотрите возможность представления вашего полного вектора результатов в приложении. Люди, которые любят сравнивать с вашим методом, но предпочитают другое измерение ошибок, могут получить такое значение из вашей таблицы.
Не отражает систематических ошибок. Представьте, что вы измеряете диаметры вместо радиусов круглых объектов. Вы ожидаете переоценку 100%, но можете достичь близкого к 1.р2
Не согласен с предыдущими комментариями, что трудно понять. Чем выше значение, тем точнее ваша модель, но она может содержать систематические ошибки.р2
Можно выразить с помощью простой для понимания формулы, где вы строите соотношение суммы квадратов невязок и делите на среднее значение:
Вы можете достичь низкого только при наличии как высокой точности (одиночные, но большие выбросы наказывают сильно), так и отсутствия систематической ошибки. Таким образом, низкий гарантирует лучшее качество, чем высокий .R MSЕ R MSЕ р2
Этот номер имеет единицу и предназначен для людей, не знакомых с вашими данными, которые нелегко интерпретировать. Например, это может быть разделено на среднее значение данных для получения . Будьте осторожны, это не единственное определение . Некоторые люди предпочитают делить на диапазон своих данных, а не делить на среднее.г е л . R MSЕ г е л . R MSЕ
Как уже упоминали другие люди, выбор может зависеть от вашей области и уровня техники. Есть ли общепринятый метод сравнения? Используйте те же измерения, что и они, и вы сможете напрямую связать преимущества своих методов в обсуждении.
источник
Как среднеквадратичная ошибка (RMSE), так и коэффициент детерминации ( )р2 предоставляют различную, но дополняющую информацию, которая должна оцениваться при оценке вашей физической модели. Ни один из них не «лучше», но некоторые отчеты могут фокусироваться больше на одной метрике в зависимости от конкретного приложения.
Я хотел бы использовать следующее в качестве очень общего руководства для понимания различий между обеими метриками:
RMSE дает вам ощущение того , насколько близко (или далеко) ваши предсказанные значения из фактических данных , которые вы пытаетесь модели. Это полезно в различных приложениях, где вы хотите понять точность и точность предсказаний вашей модели (например, высота дерева моделирования).
Pros
Cons
Коэффициент детерминации ( )р2 полезно , когда вы пытаетесь понять , насколько хорошо выбранная независимая переменная (s) объясняют изменчивость в вашей зависимой переменной (ы). Это полезно, когда вы пытаетесь объяснить, какие факторы могут влиять на основной интересующий процесс (например, климатические переменные и условия почвы, связанные с высотой дерева).
Pros
Cons
Конечно, вышеизложенное будет зависеть от размера выборки и структуры выборки, и общее понимание того, что корреляция не подразумевает причинно-следственную
источник
Существует также MAE, средняя абсолютная ошибка. В отличие от RMSE, он не слишком чувствителен к большим ошибкам. Из того, что я прочитал, некоторые поля предпочитают RMSE, другие - MAE. Мне нравится использовать оба.
источник
На самом деле, для ученых-статистиков следует знать наилучшее соответствие модели, тогда RMSE очень важен для этих людей в его надежных исследованиях. Если RMSE очень близка к нулю, тогда модель лучше всего подходит.
Коэффициент детерминации хорош для других ученых, таких как сельское хозяйство и другие области. Это значение между 0 и 1. Если оно равно 1, 100% значений соответствуют наборам наблюдаемых данных. Если это 0, то данные полностью разнородны. Dr.SK.Khadar Babu, Университет VIT, Веллоре, Тамилнад, Индия.
источник
Если к каждому элементу одного из векторов добавляется некоторое число, RMSE изменяется. То же самое, если все элементы в одном или обоих векторах умножаются на число. Код R следует;
источник
В конечном счете, разница заключается лишь в стандартизации, поскольку обе приводят к выбору одной и той же модели, поскольку RMSE, умноженное на число наблюдений, находится в числителе или R в квадрате, а знаменатель последних постоянен во всех моделях (просто нанесите одну меру против другие для 10 разных моделей).
источник