В настоящее время я анализирую данные из серии поведенческих экспериментов, которые все используют следующую меру. Участников этого эксперимента просят выбрать подсказки, которые (вымышленные) другие люди могли бы использовать, чтобы помочь решить серию из 10 анаграмм. Участники должны верить, что эти другие люди либо получат, либо потеряют деньги, в зависимости от их результатов в решении анаграмм. Подсказки различаются в том, насколько они полезны. Например, для анаграммы NUNGRIN, анаграммы RUNNING, могут быть три подсказки:
- Двигаться быстро (бесполезно)
- Что вы делаете в марафонской гонке (полезно)
- Не всегда здоровое хобби (бесполезно)
Чтобы сформировать показатель, я подсчитываю, сколько раз (из 10) участник выбирает бесполезную подсказку для другого человека. В экспериментах я использую различные манипуляции, чтобы повлиять на полезность подсказок, которые выбирают люди.
Поскольку мера полезности / бесполезности довольно сильно положительно искажена (большая часть людей всегда выбирает 10 наиболее полезных подсказок), и поскольку мера является переменной подсчета, я использую обобщенную линейную модель Пуассона для анализа этих данных. Однако, когда я сделал еще несколько чтений о регрессии Пуассона, я обнаружил, что, поскольку регрессия Пуассона не оценивает независимо среднее и дисперсию распределения, она часто недооценивает дисперсию в наборе данных. Я начал исследовать альтернативы регрессии Пуассона, такие как квазипуассоновая регрессия или отрицательная биномиальная регрессия. Тем не менее, я признаю, что я довольно новичок в таких моделях, поэтому я прихожу сюда за советом.
Кто-нибудь есть какие-либо рекомендации о том, какую модель использовать для такого рода данных? Есть ли другие соображения, о которых мне следует знать (например, является ли одна конкретная модель более мощной, чем другая?)? На какую диагностику мне следует обратить внимание, чтобы определить, правильно ли выбранная модель обрабатывает мои данные?
источник
Ответы:
Ваш результат - количество полезных подсказок из 10, что является биномиальной случайной величиной. Поэтому вам следует проанализировать его с помощью некоторой биномиальной регрессии, возможно, квазибиномиальной, чтобы учесть избыточную дисперсию. Обратите внимание, что пуассоновское и ошибочно названные отрицательные биномиальные распределения подходят для неограниченного количества данных.
источник
betabin
вaod
пакете сделаем это.Я бы также рекомендовал смотреть на отрицательный бином, если бы возможные результаты были бесконечны, как для Пуассона. Вы можете обратиться к одной из книг Джо Хильбе. У него есть один на GEE и один на отрицательной биномиальной регрессии, который он противопоставляет с пуассоновской регрессией. Но, как было указано Анико, есть только 10 подсказок, поэтому каждый респондент может иметь только 0, 1, 2, 3, ..., 10, и, следовательно, ни Пуассона, ни отрицательная экспонента не подходят.
источник
Хороший вопрос от @Aniko. Другой выбор - бета-регрессия. Была статья с названием «Лучшая соковыжималка для лимона», в которой было много информации об этом методе.
источник