Вопросы с тегом «count-data»

Данные подсчета представляют собой неотрицательные целые числа, представляющие целые суммы.

57
Почему преобразование квадратного корня рекомендуется для данных подсчета?

Часто рекомендуется брать квадратный корень, когда у вас есть данные подсчета. (Некоторые примеры CV можно найти в ответе @ HarveyMotulsky здесь или в ответе @ whuber здесь .) С другой стороны, при подборе обобщенной линейной модели с переменной отклика, распределенной как Пуассон, журнал является...

33
Почему для подсчета используется регрессия Пуассона?

Я понимаю, что для определенных наборов данных, таких как голосование, он работает лучше. Почему регрессия Пуассона используется поверх обычной линейной регрессии или логистической регрессии? Какова математическая мотивация для...

29
Метрики ошибок для перекрестной проверки моделей Пуассона

Я перекрестно проверяю модель, которая пытается предсказать счет. Если бы это была проблема бинарной классификации, я бы вычислял AUC вне складывания, а если бы это была проблема регрессии, я бы вычислял среднеквадратичное среднеквадратичное значение или MAE. Для модели Пуассона какие метрики...

25
Является ли «модель препятствий» действительно одной моделью? Или только две отдельные, последовательные модели?

Рассмотрим модель препятствий, прогнозирующую данные подсчета yот обычного предиктора x: set.seed(1839) # simulate poisson with many zeros x <- rnorm(100) e <- rnorm(100) y <- rpois(100, exp(-1.5 + x + e)) # how many zeroes? table(y == 0) FALSE TRUE 31 69 В этом случае у меня есть данные...

25
Диагностика для обобщенных линейных (смешанных) моделей (особенно остатков)

В настоящее время я пытаюсь найти подходящую модель для сложных данных подсчета (зависимая переменная). Я пробовал различные модели (модели смешанных эффектов необходимы для моего вида данных), такие как lmerи lme4(с лог-преобразованием), а также обобщенные линейные модели смешанных эффектов с...

24
Является ли этот метод подходящим для проверки сезонных эффектов в данных о количестве самоубийств?

У меня есть 17 лет (с 1995 по 2011) данных свидетельств о смерти, связанных со смертями от самоубийств для штата в США. Существует много мифологий о самоубийствах и месяцах / сезонах, большая часть которых противоречива, и литературы, которую я ' После проверки я не получил четкого представления о...

24
Непрерывное обобщение отрицательного биномиального распределения

Отрицательное биномиальное (NB) распределение определяется на неотрицательных целых числах и имеет функцию вероятности массыИмеет ли смысл рассматривать непрерывное распределение на неотрицательных вещественных числах, определенных той же формулой (заменив k \ in \ mathbb N_0 на x \ in \ mathbb R _...

23
Временные ряды для данных счета, с количеством <20

Недавно я начал работать в туберкулезной клинике. Мы периодически встречаемся, чтобы обсудить количество случаев туберкулеза, которые мы сейчас лечим, количество проведенных тестов и т. Д. Я хотел бы начать моделировать эти показатели, чтобы мы не просто угадали, является ли что-то необычным или...

21
Когда использовать данные Пуассона против геометрических и отрицательных биномиальных GLM для данных подсчета?

Я пытаюсь сделать макет для себя, когда уместно использовать тип регрессии (геометрический, пуассоновский, отрицательный бином) с данными счета в рамках GLM (только 3 из 8 распределений GLM используются для данных счета, хотя большая часть того, что Я читал центры вокруг отрицательных биномиальных...

21
Обнаружение выбросов в данных подсчета

У меня есть то, что я наивно думал, что это довольно прямая проблема, которая включает в себя обнаружение выбросов для множества различных наборов данных подсчета. В частности, я хочу определить, является ли одно или несколько значений в серии данных подсчета выше или ниже ожидаемого по сравнению с...

17
Ноль-завышенная отрицательная биномиальная модель смешанных эффектов в R

Существует ли такой пакет, который обеспечивает нулевую раздувание отрицательной биномиальной оценки модели смешанных эффектов в R? Под этим я подразумеваю: Нулевая инфляция, где вы можете указать биномиальную модель для нулевой инфляции, как в функции zeroinfl в пакете pscl: zeroinfl (y ~ X | Z,...

16
Пуассон или квази пуассон в регрессии с данными подсчета и избыточной дисперсией?

У меня есть данные подсчета (анализ спроса / предложения с подсчетом количества клиентов, в зависимости от - возможно - многих факторов). Я пробовал линейную регрессию с нормальными ошибками, но мой QQ-график не очень хорош. Я попробовал лог-преобразование ответа: еще раз плохой QQ-сюжет. Итак,...

15
Значимость различия между двумя пунктами

Есть ли способ определить, отличается ли разница между количеством дорожно-транспортных происшествий в момент времени 1 от количества в момент времени 2? Я нашел разные методы для определения различий между группами наблюдений в разное время (например, сравнение средних Пуассона), но не для...

14
Стандартная ошибка подсчета

У меня есть набор данных об инцидентах по сезонам редких заболеваний. Например, скажем, было 180 случаев весной, 90 летом, 45 осенью и 210 зимой. Я борюсь с тем, уместно ли прикреплять стандартные ошибки к этим числам. Цели исследования являются выводными в том смысле, что мы ищем сезонную картину...

14
Нарушает ли использование данных подсчета в качестве независимой переменной какое-либо из предположений GLM?

Я хотел бы использовать данные подсчета в качестве ковариат при подборе модели логистической регрессии. Мой вопрос: Нарушаю ли я какое-либо предположение о логистической (и, в целом, об обобщенной линейной) модели, используя в качестве независимых переменных неотрицательные целочисленные...

13
R / Stata пакет для отрицательно усеченного отрицательного бинома GEE?

Это мой первый пост. Я действительно благодарен за это сообщество. Я пытаюсь проанализировать данные продольного счета, которые укорочены до нуля (вероятность того, что переменная отклика = 0 равна 0), а среднее значение! = Дисперсия, поэтому для пуассона было выбрано отрицательное биномиальное...

12
Выбор альтернатив пуассоновской регрессии для данных о сверхдисперсных счетчиках

В настоящее время я анализирую данные из серии поведенческих экспериментов, которые все используют следующую меру. Участников этого эксперимента просят выбрать подсказки, которые (вымышленные) другие люди могли бы использовать, чтобы помочь решить серию из 10 анаграмм. Участники должны верить, что...

12
Параметрическое моделирование дисперсии данных счета

Я хочу смоделировать некоторые данные, но я не уверен, какой тип модели я могу использовать. У меня есть данные подсчета, и я хочу модель, которая даст параметрические оценки как среднего значения, так и дисперсии данных. То есть у меня есть различные прогностические факторы, и я хочу определить,...

12
Одинаковые коэффициенты, оцениваемые в модели Пуассона и Квази-Пуассона

При моделировании данных подсчета претензий в страховой среде я начал с Пуассона, но затем заметил чрезмерную дисперсию. Квази-Пуассон лучше моделировал большее отношение средней дисперсии, чем основной Пуассон, но я заметил, что коэффициенты были идентичны как в модели Пуассона, так и в модели...