Как рассчитать 95% доверительный интервал для нелинейного уравнения?

10

У меня есть уравнение, чтобы предсказать вес ламантинов от их возраста, в днях (dias, на португальском языке):

R <- function(a, b, c, dias) c + a*(1 - exp(-b*dias))

Я смоделировал это в R, используя nls (), и получил этот рисунок:

введите описание изображения здесь

Теперь я хочу рассчитать 95% доверительный интервал и построить его на графике. Я использовал нижний и верхний пределы для каждой переменной a, b и c, например:

lower a = a - 1.96*(standard error of a)
higher a = a + 1.96*(standard error of a)
(the same for b and c)

затем я строю нижнюю линию, используя более низкие a, b, c, и более высокую линию, используя более высокие a, b, c. Но я не уверен, что это правильный способ сделать это. Это дает мне эту графику:

введите описание изображения здесь

Это способ сделать это, или я делаю это неправильно?

Родриго
источник

Ответы:

13
  1. Этот QA на этом сайте объясняет математику для создания доверительных полос вокруг кривых, сгенерированных нелинейной регрессией: Форма доверительных интервалов и интервалов прогнозирования для нелинейной регрессии

  2. Если вы читаете дальше, это поможет отличить доверительные интервалы для параметров из доверительных полос для кривой.

  3. Глядя на ваш график, вы увидите, что у вас есть данные по четырем животным, которые измеряются по многим дням. Если это так, то одновременная подгонка всех данных нарушает одно из предположений регрессии - что каждая точка данных независима (или что каждый остаток имеет независимую «ошибку»). Вы можете рассмотреть возможность подгонки каждого животного по отдельности или использовать смешанную модель для подбора всех сразу.

Харви Мотульский
источник
5
+1 Третий пункт имеет решающее значение: любые попытки вычислить КИ или доверительные интервалы, предполагая, что эти данные независимы, приведут к ужасно неадекватным (то есть коротким ) интервалам. Это может помочь ОП подчеркнуть, что метод, предложенный в этом вопросе, определенно неверен: он пренебрегает (сильной) корреляцией между оценками параметров и неправильно агрегирует доверительные пределы. Чистый результат на самом деле выглядит разумным (чисто случайно и удачей), но, на мой взгляд, он все еще недостаточно консервативен.
whuber