В настоящее время я пытаюсь применить линейную модель ( family = gaussian
) к индикатору биоразнообразия, который не может принимать значения ниже нуля, имеет нулевое раздувание и непрерывен. Значения варьируются от 0 до чуть более 0,25. Как следствие, в остатках модели есть довольно очевидная закономерность, от которой мне не удалось избавиться:
У кого-нибудь есть идеи как это решить?
Ответы:
Существует множество решений для случая раздуваемых (полу) непрерывных распределений:
Или, если ваша структура данных достаточно проста, вы можете просто использовать линейные модели и использовать тесты перестановки или другой надежный подход, чтобы убедиться, что ваш вывод не будет испорчен интересным распределением данных.
Для большинства этих случаев доступны пакеты R / решения.
Есть другие вопросы по SE о ноль-накачанных (полу) непрерывных данных (например, здесь , здесь и здесь ), но они не дают четкого общего ответа ...
См. Также Min & Agresti, 2002, Моделирование неотрицательных данных со слиянием в ноль: обзор для обзора.
источник