Доверительный интервал RMSE

20

Я взял выборку из точек данных от населения. Каждый из этих пунктов имеет истинное значение (известное из основной истины) и оценочное значение. Затем я вычисляю погрешность для каждой точки выборки, а затем вычисляю среднеквадратичное значение выборки.N

Как тогда я могу вывести некоторый доверительный интервал вокруг этого RMSE, основываясь на размере выборки ?N

Если бы я использовал среднее значение, а не RMSE, то у меня не было бы проблем с этим, поскольку я мог бы использовать стандартное уравнение

мзнак равноZσN

но я не знаю, действительно ли это для RMSE, а не для среднего значения. Есть ли способ, которым я могу это адаптировать?

(Я видел этот вопрос , но у меня нет проблем с тем, нормально ли распределено мое население, и именно это и есть в ответе)

robintw
источник
Что конкретно вы вычисляете, когда вы «рассчитываете RMSE образца»? Является ли это RMSE из истинных значений, из оценочных значений, или их различия?
whuber
2
Я вычисляю среднеквадратичное значение разностей, то есть вычисляю квадратный корень из среднего квадрата разностей между истинными и оценочными значениями.
robintw
Если вы знаете «основную правду» (хотя я не уверен, что это на самом деле означает), зачем вам нужна неопределенность в RMSE? Вы пытаетесь построить какой-то вывод о случаях, когда у вас нет правды? Это проблема калибровки?
Glen_b
@Glen_b: Да, это именно то, что мы пытаемся сделать. У нас нет основной истины для всего населения, только для образца. Затем мы рассчитываем среднеквадратическое среднеквадратичное отклонение для выборки, и мы хотим иметь доверительные интервалы для этого, поскольку мы используем эту выборку, чтобы вывести среднеквадратическое среднеквадратичное отклонение населения.
robintw
1
Возможный дубликат SE RMSE в R
Любопытно

Ответы:

15

С такими же рассуждениями, как здесь , я мог бы дать ответ на ваш вопрос при определенных условиях.

Пусть будет вашим истинным значением для точки данных а - оценочным значением. Если предположить, что различия между оценочными и истинными значениями имеют я т ч х яИксяяTчасИкс^я

  1. средний ноль (т. е. распределены вокруг )хяИкс^яИкся

  2. следовать нормальному распределению

  3. и у всех одинаковое стандартное отклонениеσ

короче говоря:

Икс^я-Икся~N(0,σ2),

тогда вам действительно нужен доверительный интервал для .σ

Если вышеприведенные предположения верны, следует распределению с (не ) степенями свобода. Это означает χ 2 n nn-1

NRMSE2σ2знак равноN1NΣя(Икся^-Икся)2σ2
χN2NN-1

п(χα2,N2NRMSE2σ2χ1-α2,N2)знак равно1-αп(NRMSE2χ1-α2,N2σ2NRMSE2χα2,N2)знак равно1-αп(Nχ1-α2,N2RMSEσNχα2,N2RMSE)знак равно1-α,

Поэтому - ваш доверительный интервал.

[Nχ1-α2,N2RMSE,Nχα2,N2RMSE]

Вот программа на Python, которая имитирует вашу ситуацию

from scipy import stats
from numpy import *
s = 3
n=10
c1,c2 = stats.chi2.ppf([0.025,1-0.025],n)
y = zeros(50000)
for i in range(len(y)):
    y[i] =sqrt( mean((random.randn(n)*s)**2))

print "1-alpha=%.2f" % (mean( (sqrt(n/c2)*y < s) & (sqrt(n/c1)*y > s)),)

Надеюсь, это поможет.

Если вы не уверены, применимы ли предположения или если вы хотите сравнить то, что я написал, с другим методом, вы всегда можете попробовать начальную загрузку .

fabee
источник
1
Я думаю, что вы не правы - он хочет CI для RMSE, а не . И я тоже этого хочу :)σ
Любопытно
1
Я не думаю, что я не прав. Подумайте об этом так: MSE - это пример дисперсии, поскольку . Единственное отличие состоит в том, что вы делите на а не на поскольку здесь вы не вычитаете среднее значение выборки. Тогда RMSE будет соответствовать . Следовательно, RMSE населения - это и для этого вам нужен CI. Это то, что я получил. В противном случае я должен полностью понять вашу проблему. пп-1сгсгMSEзнак равноσ^2знак равно1NΣязнак равно1N(Икся-Икс^я)2NN-1σσ
Fabee
10

Рассуждения в ответе fabee кажутся правильными, если их применять к стандарту STDE (стандартное отклонение ошибки), а не к RMSE. Используя аналогичную номенклатуру, - индекс, представляющий каждую запись данных, - истинное значение, а - измерение или прогноз.х я х яязнак равно1,...,NИксяИкс^я

Ошибка , BIAS, MSE (среднеквадратическая ошибка) и RMSE определяются как: εя

εязнак равноИкс^я-Икся,BIASзнак равноε¯знак равно1NΣязнак равно1Nεя,MSEзнак равноε2¯знак равно1NΣязнак равно1Nεя2,RMSEзнак равноMSE,

Согласившись с этими определениями, BIAS соответствует среднему значению выборки , но MSE не является отклонением выборки смещения. Вместо этого: или, если были вычислены как BIAS, так и RMSE, Обратите внимание, что смещенная выборочная дисперсия используется вместо несмещенной , чтобы сохранить согласованность с предыдущими определениями, данными для MSE и RMSE.ε

STDE2знак равно(ε-ε¯)2¯знак равно1NΣязнак равно1N(εя-ε¯)2,
STDE2знак равно(ε-ε¯)2¯знак равноε2¯-ε¯2знак равноRMSE2-BIAS2,

Таким образом, по моему мнению, доверительные интервалы, установленные fabee, относятся к стандартному отклонению выборки , STDE. Аналогично, доверительные интервалы могут быть установлены для BIAS на основе z-оценки (или t-оценки, если ) и,εN<30STDE/N

CVR
источник
2
Вы правы, но пропустили часть моего ответа. Я в основном предполагал, что BIAS = 0 (см. Предположение 1). В этом случае как вы получили. Поскольку и являются и существует решение для близкой формы для суммы двух RV, вы, вероятно, можете получить близкий доверительный интервал формы для случая, когда предположение 1 отбрасывается. Если вы сделаете это и обновите свой ответ, я обязательно проголосую. R M S E 2 B I A S 2 χ 2 χ 2рMSЕ2знак равноSТDЕ2рMSЕ2ВяAS2χ2χ2
Fabee
0

После Faaber 1999 года неопределенность RMSE задается как где - количество точек данных. n

σ(рMSЕ^)/рMSЕзнак равно12N
N
LKlevin
источник