Я рецензирую статью, в которой есть следующий биологический эксперимент. Устройство используется, чтобы подвергать клетки различным величинам напряжения сдвига жидкости. По мере того как к клеткам прикладывается большее напряжение сдвига, большее их количество начинает отрываться от субстрата. На каждом уровне напряжения сдвига они подсчитывают количество клеток, которые остаются прикрепленными, и, поскольку они знают общее количество клеток, которые были присоединены в начале, они могут рассчитать дробное присоединение (или отделение).
Если вы построите график зависимости адгезионной фракции от напряжения сдвига, результатом будет логистическая кривая. Теоретически, каждая отдельная ячейка - это отдельное наблюдение, но очевидно, что существуют тысячи или десятки тысяч ячеек, поэтому набор данных был бы гигантским, если бы он был установлен обычным образом (с каждой строкой, являющейся наблюдением).
Поэтому, естественно, мой вопрос (как указано в заголовке) должен иметь смысл сейчас. Как мы делаем логистическую регрессию, используя дробный результат в качестве DV? Есть ли автоматическое преобразование, которое можно сделать в GLM?
В том же духе, если бы было потенциально 3 или более (дробных) измерений, как можно было бы сделать это для полиномиальной логистической регрессии?
источник
http://www.ats.ucla.edu/stat/r/dae/mlogit.htm
Ответы:
glm
ФункцияR
позволяет 3 способа указать формулу для модели логистической регрессии.Наиболее распространенным является то, что каждая строка фрейма данных представляет одно наблюдение, а переменная отклика равна либо 0, либо 1 (или коэффициент с 2 уровнями, или другой вариант с только 2 уникальными значениями).
Другой вариант - использовать матрицу из 2 столбцов в качестве переменной ответа, причем первый столбец - это счетчик «успехов», а второй столбец - счетчик «неудач».
Вы также можете указать ответ в виде пропорции от 0 до 1, а затем указать другой столбец в качестве «веса», который дает общее число, из которого получена пропорция (таким образом, ответ 0,3 и вес 10 равен 3 ». успехи »и 7« неудач »).
Любой из последних двух способов подойдет для того, что вы пытаетесь сделать, последний кажется наиболее прямым для описания ваших данных.
источник
Для начала, если у вас есть зависимая переменная, которая является пропорцией, вы можете использовать бета-регрессию. Это не распространяется (с моими ограниченными знаниями) на несколько пропорций.
Для обзора бета-регрессии и реализации R ознакомьтесь с бетарегом .
источник
Я использовал
nnet::multinom
(пакет nnet является частью MASS) для аналогичной цели, он принимает непрерывный ввод в [0, 1].Если вам нужна ссылка: C. Beleites et.al .: Рамановская спектроскопическая классификация тканей астроцитомы: использование мягкой справочной информации. Anal Bioanal Chem, 2011, Vol. 400 (9), стр. 2801-2816
источник