Итак, ради интереса, я беру некоторые данные о вызовах из колл-центра, в котором я работаю, и пытаюсь проверить их на гипотезы, в частности, количество звонков, полученных за неделю, и использую распределение Пуассона, чтобы соответствовать ему. Из-за предмета моей работы, есть два типа недель, давайте назовем одну из них неделями, когда я предполагаю, что есть больше звонков, и неделями, когда я предполагаю, что есть меньше.
У меня есть теория, что из недели (назовем это ) больше, чем (давайте назовем это )λ 1 λ 2
Таким образом, гипотеза, которую я хочу проверить:
Я знаю, как проверить один параметр (скажем, ), но не совсем уверен, как поступить 2 с данным набором данных. Допустим, я беру по две недели данных от каждого из и для выходного дня, а и для дня. Может ли кто-нибудь помочь мне пройти через эту более простую версию, чтобы я мог применить ее к большему набору данных? Любая помощь приветствуется, спасибо.X 1 = 2 X 2 = 3 Y 1 = 2 Y 2 = 6
источник
Ответы:
Обратите внимание, что обычно равенство обнуляется (по уважительной причине).
Помимо этой проблемы, я упомяну пару подходов к проверке такого рода гипотез
Тогда при нулевом значении ожидаемые пропорции: и соответственно. Вы можете сделать односторонний тест пропорции в неделях довольно легко. woffвеснавес весотвес
Есть и другие варианты.
источник
Как насчет того, чтобы использовать GLM со структурой ошибок Пуассона и log-link ??? Но идея о биноме может быть более мощной.
источник
Я бы согласился с пуассоновским или квазипуассоновским GLM с предпочтением квазипуассоновского или отрицательного бинома.
Проблема с использованием традиционного Пуассона состоит в том, что требуется, чтобы дисперсия и среднее значение были равны, что, скорее всего, не так. Квази-Пуассон или NB оценивает дисперсию, неограниченную средним.
Вы можете сделать любой из них в R очень легко.
Подход GLM полезен, и, поскольку вы можете расширить его, включив в него дополнительные переменные (например, месяц года), которые могут повлиять на объем вызовов.
Чтобы сделать это вручную, я бы, вероятно, использовал нормальное приближение и t-критерий из двух выборок.
источник
Начнем с оценки максимального правдоподобия для параметра Пуассона, который является средним значением.
Итак,λ^1= Y¯ а н д λ^2= Х¯
Теперь вы можете просто протестироватьY¯- Х¯∼ N( λ1- λ2, λ1N1+ λ2N2)
а затем сравните, получив Z-значение =( Y¯- Х¯) - λ1- λ2λ1N1+ λ2N2√
Примечание: критерий отклонения -Z< Cг я т I с в л V л у й
источник
Начиная со страницы 125 тестовой статистической гипотезы Казеллы, намечается ответ на вопрос, который вы сформулировали. Я приложил ссылку на PDF-файл, который я нашел в Интернете для вашей справки. Каселла, проверяющая статистическую гипотезу, третье издание .
источник