Я относительно новичок в статистике и был бы признателен за помощь в понимании этого вопроса.
В моей области есть широко используемая модель вида:
Когда люди подгоняют модель к данным, они обычно линеаризуют ее и соответствуют следующим
Это нормально? Я где-то читал, что из-за шума в сигнале фактическая модель должна быть
и это не может быть линеаризовано, как указано выше. Это правда? Если да, кто-нибудь знает ссылку, которую я могу прочитать и узнать о ней больше, и, вероятно, привести в отчете?
modeling
model
error
curve-fitting
measurement-error
ciaran_r
источник
источник
Ответы:
Какая модель подходит, зависит от того, как вариация вокруг среднего значения входит в наблюдения. Это может прийти мультипликативно или аддитивно ... или каким-то другим способом.
Может быть даже несколько источников этого изменения, некоторые из которых могут входить мультипликативно, а некоторые - аддитивно, а некоторые способами, которые на самом деле нельзя охарактеризовать как таковые.
Иногда есть четкая теория, чтобы установить, что подходит. Иногда размышления об основных источниках отклонения от среднего значения показывают соответствующий выбор. Часто люди не имеют четкого представления о том, что использовать, или если для адекватного описания процесса могут потребоваться различные источники вариаций.
С лог-линейной моделью, где используется линейная регрессия:
модель регрессии OLS предполагает постоянную дисперсию логарифмического масштаба, и если это так, то исходные данные будут демонстрировать растущий разброс по среднему значению при увеличении среднего.
С другой стороны, эта модель:
обычно устанавливается нелинейными наименьшими квадратами, и, опять же, если установлена постоянная дисперсия (по умолчанию для NLS), то разброс вокруг среднего значения должен быть постоянным.
[У вас может возникнуть визуальное впечатление, что разброс уменьшается с увеличением среднего значения на последнем изображении; на самом деле это иллюзия, вызванная увеличением наклона - мы склонны судить о распространении, ортогональном к кривой, а не по вертикали, поэтому мы получаем искаженное впечатление.]
Если у вас почти постоянный разброс либо в исходном, либо в логарифмическом масштабе, это может указывать на то, какая из двух моделей подходит, не потому, что это доказывает, что оно является аддитивным или мультипликативным, а потому, что оно приводит к надлежащему описанию как спреда, так и жадный.
Конечно, можно также иметь возможность аддитивной ошибки, которая имеет непостоянную дисперсию.
Тем не менее, существуют и другие модели, в которых можно подобрать такие функциональные отношения, которые имеют разные отношения между средним и дисперсией (например, пуассоновское или квазипуассоновское GLM, которое распространилось пропорционально квадратному корню из среднего значения).
источник