Проверка гипотезы Пуассона для двух параметров

9

Итак, ради интереса, я беру некоторые данные о вызовах из колл-центра, в котором я работаю, и пытаюсь проверить их на гипотезы, в частности, количество звонков, полученных за неделю, и использую распределение Пуассона, чтобы соответствовать ему. Из-за предмета моей работы, есть два типа недель, давайте назовем одну из них неделями, когда я предполагаю, что есть больше звонков, и неделями, когда я предполагаю, что есть меньше.

У меня есть теория, что из недели (назовем это ) больше, чем (давайте назовем это )λ 1 λ 2λλ1λ2

Таким образом, гипотеза, которую я хочу проверить:H0:λ1>λ2,H1:λ1λ2

Я знаю, как проверить один параметр (скажем, ), но не совсем уверен, как поступить 2 с данным набором данных. Допустим, я беру по две недели данных от каждого из и для выходного дня, а и для дня. Может ли кто-нибудь помочь мне пройти через эту более простую версию, чтобы я мог применить ее к большему набору данных? Любая помощь приветствуется, спасибо.X 1 = 2 X 2 = 3 Y 1 = 2 Y 2 = 6H0:λ1>1,H1:λ11X1=2X2=3Y1=2Y2=6

Джеймс Снайдер
источник
3
Распространены ли звонки по пуассону? Если звонков много, их лучше всего смоделировать как нормальные. Но это может убить веселье.
RegressForward
1
Ну, что определяет, как это правильно оформить? Я получаю x количество дискретных звонков в единицу времени. Я мог бы сделать это как обычный дистрибутив, но суть в том, что я хотел бы попробовать это с Пуассоном, так как он подходит.
Джеймс Снайдер
Если вы предполагаете, что счет Пуассона, то вы можете просто добавить счет (поправьте меня, если я ошибаюсь). То есть вы бы получили X = 2 + 3 и Y = 2 + 6. Затем вы можете проверить разницу, используя, например, «poisson.test» в R. Если вы хотите попробовать байесовский анализ, у меня также есть сообщение в блоге об этом здесь: sumsar.net/blog/2014/ 09 /
Байесовский

Ответы:

4

Обратите внимание, что обычно равенство обнуляется (по уважительной причине).

Помимо этой проблемы, я упомяну пару подходов к проверке такого рода гипотез

  1. Очень простой тест: условие на общее наблюдаемое число , которое преобразует его в биномиальный критерий пропорций. Представьте, что есть -неделя и -день недели и недели вместе взятые.ш о ш от шnwonwoffw

Тогда при нулевом значении ожидаемые пропорции: и соответственно. Вы можете сделать односторонний тест пропорции в неделях довольно легко. woffwonwwoffw

  1. Вы можете построить односторонний тест, адаптировав статистику, относящуюся к тесту отношения правдоподобия; z-форму теста Вальда или тестов с оценками можно сделать, например, односторонними, и они должны хорошо работать для largish .λ

Есть и другие варианты.

Glen_b - Восстановить Монику
источник
1

Как насчет того, чтобы использовать GLM со структурой ошибок Пуассона и log-link ??? Но идея о биноме может быть более мощной.

Иван Кшнясев
источник
В настоящее время это скорее комментарий, чем ответ. Вы намеревались это как комментарий, вопрос для разъяснения или ответ? Если последнее, вы можете расширить его в ответ? Мы также можем преобразовать его в комментарий для вас.
gung - Восстановить Монику
1

Я бы согласился с пуассоновским или квазипуассоновским GLM с предпочтением квазипуассоновского или отрицательного бинома.

Проблема с использованием традиционного Пуассона состоит в том, что требуется, чтобы дисперсия и среднее значение были равны, что, скорее всего, не так. Квази-Пуассон или NB оценивает дисперсию, неограниченную средним.

Вы можете сделать любой из них в R очень легко.

# week on = 1, week off = 0
week.status <- c(1, 1, 0, 0)
calls <- c(2, 6, 2, 3)
model <- glm(calls ~ week.status, family = poisson())
# or change the poisson() after family to quasipoisson() 
# or use the neg binomial glm from the MASS package

Подход GLM полезен, и, поскольку вы можете расширить его, включив в него дополнительные переменные (например, месяц года), которые могут повлиять на объем вызовов.

Чтобы сделать это вручную, я бы, вероятно, использовал нормальное приближение и t-критерий из двух выборок.

iacobus
источник
1

Начнем с оценки максимального правдоподобия для параметра Пуассона, который является средним значением.

Итак,λ^1знак равноY¯  aNd  λ^2знак равноИкс¯

Теперь вы можете просто протестироватьY¯-Икс¯~N(λ1-λ2,λ1N1+λ2N2)

а затем сравните, получив Z-значение =(Y¯-Икс¯)-λ1-λ2λ1N1+λ2N2

Примечание: критерий отклонения -Z<СряTясaL ВaLUе

Хемант Рупани
источник
0

Начиная со страницы 125 тестовой статистической гипотезы Казеллы, намечается ответ на вопрос, который вы сформулировали. Я приложил ссылку на PDF-файл, который я нашел в Интернете для вашей справки. Каселла, проверяющая статистическую гипотезу, третье издание .

Нужи Мейен
источник
Хороший указатель, однако ссылки только для ответов не рекомендуются при перекрестной проверке. Не могли бы вы набросать разрешение в своем ответе? Спасибо.
Сиань
Извините, я не знал об этом правиле. Спасибо, что сообщили мне знать. :) Постараюсь дать исчерпывающий ответ как можно скорее.
Нужи Мейен