Проверка гипотезы Пуассона для двух параметров

9

Итак, ради интереса, я беру некоторые данные о вызовах из колл-центра, в котором я работаю, и пытаюсь проверить их на гипотезы, в частности, количество звонков, полученных за неделю, и использую распределение Пуассона, чтобы соответствовать ему. Из-за предмета моей работы, есть два типа недель, давайте назовем одну из них неделями, когда я предполагаю, что есть больше звонков, и неделями, когда я предполагаю, что есть меньше.

У меня есть теория, что из недели (назовем это ) больше, чем (давайте назовем это ) $\lambda$ $\lambda_1$ $\lambda_2$

Таким образом, гипотеза, которую я хочу проверить: $H_0: \lambda_1 > \lambda_2, H_1: \lambda_1 \leq \lambda_2$

Я знаю, как проверить один параметр (скажем, ), но не совсем уверен, как поступить 2 с данным набором данных. Допустим, я беру по две недели данных от каждого из и для выходного дня, а и для дня. Может ли кто-нибудь помочь мне пройти через эту более простую версию, чтобы я мог применить ее к большему набору данных? Любая помощь приветствуется, спасибо. $H_0: \lambda_1 > 1, H_1: \lambda_1 \leq 1$ $X_1 = 2$ $X_2 = 3$ $Y_1 = 2$ $Y_2=6$

hypothesis-testing poisson-distribution Джеймс Снайдер
источник

3

Распространены ли звонки по пуассону? Если звонков много, их лучше всего смоделировать как нормальные. Но это может убить веселье.

RegressForward

1

Ну, что определяет, как это правильно оформить? Я получаю x количество дискретных звонков в единицу времени. Я мог бы сделать это как обычный дистрибутив, но суть в том, что я хотел бы попробовать это с Пуассоном, так как он подходит.

Джеймс Снайдер

Если вы предполагаете, что счет Пуассона, то вы можете просто добавить счет (поправьте меня, если я ошибаюсь). То есть вы бы получили X = 2 + 3 и Y = 2 + 6. Затем вы можете проверить разницу, используя, например, «poisson.test» в R. Если вы хотите попробовать байесовский анализ, у меня также есть сообщение в блоге об этом здесь: sumsar.net/blog/2014/ 09 /

Байесовский

4

Обратите внимание, что обычно равенство обнуляется (по уважительной причине).

Помимо этой проблемы, я упомяну пару подходов к проверке такого рода гипотез

Очень простой тест: условие на общее наблюдаемое число , которое преобразует его в биномиальный критерий пропорций. Представьте, что есть -неделя и -день недели и недели вместе взятые. $n$ $w_\text{on}$ $w_\text{off}$ $w$

Тогда при нулевом значении ожидаемые пропорции: и соответственно. Вы можете сделать односторонний тест пропорции в неделях довольно легко. $\frac{w_\text{on}}{w}$ $\frac{w_\text{off}}{w}$

Вы можете построить односторонний тест, адаптировав статистику, относящуюся к тесту отношения правдоподобия; z-форму теста Вальда или тестов с оценками можно сделать, например, односторонними, и они должны хорошо работать для largish . $\lambda$

Есть и другие варианты.

Glen_b - Восстановить Монику
источник

1

Как насчет того, чтобы использовать GLM со структурой ошибок Пуассона и log-link ??? Но идея о биноме может быть более мощной.

Иван Кшнясев
источник

В настоящее время это скорее комментарий, чем ответ. Вы намеревались это как комментарий, вопрос для разъяснения или ответ? Если последнее, вы можете расширить его в ответ? Мы также можем преобразовать его в комментарий для вас.

gung - Восстановить Монику

1

Я бы согласился с пуассоновским или квазипуассоновским GLM с предпочтением квазипуассоновского или отрицательного бинома.

Проблема с использованием традиционного Пуассона состоит в том, что требуется, чтобы дисперсия и среднее значение были равны, что, скорее всего, не так. Квази-Пуассон или NB оценивает дисперсию, неограниченную средним.

Вы можете сделать любой из них в R очень легко.

# week on = 1, week off = 0
week.status <- c(1, 1, 0, 0)
calls <- c(2, 6, 2, 3)
model <- glm(calls ~ week.status, family = poisson())
# or change the poisson() after family to quasipoisson() 
# or use the neg binomial glm from the MASS package

Подход GLM полезен, и, поскольку вы можете расширить его, включив в него дополнительные переменные (например, месяц года), которые могут повлиять на объем вызовов.

Чтобы сделать это вручную, я бы, вероятно, использовал нормальное приближение и t-критерий из двух выборок.

iacobus
источник

1

Начнем с оценки максимального правдоподобия для параметра Пуассона, который является средним значением.

Итак, $\hat\lambda_1=\bar Y~~and~~\hat\lambda_2=\bar X$

Теперь вы можете просто протестировать $\bar Y-\bar X\sim N(\lambda_1-\lambda_2,\frac{\lambda_1}{n_1}+\frac{\lambda_2}{n_2})$

а затем сравните, получив Z-значение = $\frac{(\bar Y-\bar X)-\lambda_1-\lambda_2}{\sqrt{\frac{\lambda_1}{n_1}+\frac{\lambda_2}{n_2}}}$

Примечание: критерий отклонения - $Z<Critical~Value$

Хемант Рупани
источник

0

Начиная со страницы 125 тестовой статистической гипотезы Казеллы, намечается ответ на вопрос, который вы сформулировали. Я приложил ссылку на PDF-файл, который я нашел в Интернете для вашей справки. Каселла, проверяющая статистическую гипотезу, третье издание .

Нужи Мейен
источник

Хороший указатель, однако ссылки только для ответов не рекомендуются при перекрестной проверке. Не могли бы вы набросать разрешение в своем ответе? Спасибо.

Сиань

Извините, я не знал об этом правиле. Спасибо, что сообщили мне знать. :) Постараюсь дать исчерпывающий ответ как можно скорее.

Нужи Мейен

Проверка гипотезы Пуассона для двух параметров

Ответы: