Я думаю о построении модели, предсказывающей отношение , где и и . Таким образом, соотношение будет между и .a > 0 b > 0 0 1
Я мог бы использовать линейную регрессию, хотя она, естественно, не ограничивается 0..1. У меня нет оснований полагать, что отношения являются линейными, но, конечно, они все равно часто используются в качестве простой первой модели.
Я мог бы использовать логистическую регрессию, хотя обычно она используется для прогнозирования вероятности исхода из двух состояний, а не для прогнозирования непрерывного значения из диапазона 0..1.
Больше ничего не зная, будете ли вы использовать линейную регрессию, логистическую регрессию или скрытый вариант c ?
Ответы:
Вы должны выбрать «скрытую опцию c», где c - бета-регрессия. Это тип регрессионной модели, который подходит, когда переменная ответа распространяется как бета-версия . Вы можете думать об этом как об аналоге обобщенной линейной модели . Это именно то, что вы ищете. Существует пакет в
R
называется betareg , которая занимается этим. Я не знаю, используете ли выR
, но даже если вы не сможете прочитать «виньетки», они все равно дадут вам общую информацию о теме в дополнение к тому, как ее реализоватьR
(что вам не нужно в тот случай).Изменить (гораздо позже): Позвольте мне сделать быстрое разъяснение. Я интерпретирую вопрос как отношение двух положительных реальных ценностей. Если это так, (и они распространяются как Gammas), то это бета-версия. Однако, если является подсчетом «успехов» из известного общего количества, «испытаний», то это будет пропорция подсчета , а не непрерывная пропорция, и вы должны использовать биномиальный GLM (например, логистический регрессия). О том, как сделать это в R, см., Например, Как сделать логистическую регрессию в R, когда результат является дробным (отношение двух отсчетов)?б а / бa б а / б
Другая возможность заключается в использовании линейной регрессии, если отношения можно преобразовать так, чтобы она соответствовала предположениям стандартной линейной модели, хотя я не был бы оптимистичен по поводу того, что это действительно работает.
источник
Это парные образцы или две независимые популяции?
Ваше перехват этой регрессии будет log (B), а ваш наклон будет log (отношение).
Смотрите больше здесь:
Бейен Дж., Мойнеддин Р. Методы оценки доверительного интервала параметра отношения с применением к коэффициентам местоположения. BMC методология медицинских исследований. 2005; 5 (1): 32.
РЕДАКТИРОВАТЬ: я написал аддон SPSS, чтобы сделать именно это. Я могу поделиться этим, если вам интересно.
источник
REGRESSION
после преобразования данных журнала. С тех пор я написал более сложную версию, которая используетGLM
. Я имею дело с измерениями светового излучения, и мое тестирование показало, что гамма-регрессия с логарифмической связью была наименее склонной к неуверенной неопределенности параметров. Для большинства моих реальных данных ответы от использования нормального, отрицательного биномиального и гамма-связи с log-link были действительно очень похожи (по крайней мере, на ту точность, которая мне была нужна)источник