Проверка, имеют ли два образца Пуассона одинаковое среднее

30

Это элементарный вопрос, но я не смог найти ответ. У меня есть два измерения: n1 события во время t1 и n2 события во время t2, оба произведенные (скажем) пуассоновскими процессами с возможно различными значениями лямбда.

Это на самом деле из новостной статьи, которая, по сути, утверждает, что, поскольку что они разные, но я не уверен, что утверждение является действительным. Предположим, что периоды времени не были выбраны злонамеренно (чтобы максимизировать события в одном или другом).N1/T1N2/T2

Могу ли я просто провести t- тест или это будет неуместно? Количество событий слишком мало для меня, чтобы удобно называть распределения примерно нормальными.

Чарльз
источник
1
Прекрасный образец научной журналистики, там ...
Мэтт Паркер
1
Да ... вы можете понять, почему я хотел проверить используемую статистику.
Чарльз

Ответы:

25

Для проверки среднего Пуассона условный метод был предложен Przyborowski and Wilenski (1940). Условное распределение X1 при заданном X1 + X2 следует биномиальному распределению, вероятность успеха которого является функцией отношения двух лямбда. Таким образом, процедуры проверки гипотез и оценки интервалов могут быть легко разработаны на основе точных методов, позволяющих сделать выводы о вероятности биномиального успеха. Обычно для этого рассматриваются два метода:

  1. С-тест
  2. E-тест

Вы можете найти подробности об этих двух тестах в этой статье. Более мощный тест для сравнения двух средних Пуассона

Вазир
источник
4
+1 Хорошая ссылка, спасибо. С-тест является более строгой версией того, что я набросал, так что его стоит рассмотреть. E-тест связывает t-статистику с соответствующим распределением. Вычисление этого распределения включает в себя двойную бесконечную сумму, которая потребует вычислений, чтобы сходиться: довольно легко кодировать, вероятно, излишне для проверки газеты! О(N1N2)
whuber
1
Автор статьи E-test написал простую реализацию на Фортране для вычисления p-значений для двух средних Пуассона: ucs.louisiana.edu/~kxk4695 Я перенес их фортран в MATLAB здесь git.io/vNP86
AndyL
11

Как насчет:

poisson.test(c(n1, n2), c(t1, t2), alternative = c("two.sided"))

Это тест, который сравнивает коэффициенты Пуассона 1 и 2 друг с другом, и дает значение ap и 95% доверительный интервал.

Роб ван Гемерт
источник
Следует отметить , что для двух образцов задачи, это использует биномиальный тест , чтобы сравнить цены
Jon
10

Вы ищете быструю и легкую проверку.

λTзнак равноT1+T2[0,T1]N1[T1,T1+T2]N2

λ^знак равноN1+N2T1+T2

NяTяλ^Nя

Whuber
источник
1
Спасибо (+1), это просто правильная проверка для такого рода вещей. Это оказалось очень значимым (р = 0,005), поэтому статья в порядке. Я надеюсь, что вы не возражаете, что я принял другой ответ - хорошо знать «реальный» способ сделать это, когда это важно.
Чарльз
5

Я был бы более заинтересован в доверительном интервале, чем в значении ap, вот приблизительное приближение.

Сначала вычисляем длины интервалов и проверяем:

Lrec = as.numeric(as.Date("2010-07-01") - as.Date("2007-12-02")) # Length of recession
Lnrec = as.numeric(as.Date("2007-12-01") - as.Date("2001-12-01")) # L of non rec period
(43/Lrec)/(50/Lnrec)

[1] 2.000276

Эта проверка дает немного другой результат (увеличение на 100,03%), чем публикация (увеличение на 101%). Продолжайте с начальной загрузкой (сделайте это дважды):

N = 100000
k=(rpois(N, 43)/Lrec)/(rpois(N, 50)/Lnrec)
c(quantile(k, c(0.025, .25, .5, .75, .975)), mean=mean(k), sd=sd(k))

     2.5%       25%       50%       75%     97.5%      mean        sd 
1.3130094 1.7338545 1.9994599 2.2871373 3.0187243 2.0415132 0.4355660 

     2.5%       25%       50%       75%     97.5%      mean        sd 
1.3130094 1.7351970 2.0013578 2.3259023 3.0173868 2.0440240 0.4349706 

95% доверительный интервал увеличения составляет от 31% до 202%.

GaBorgulya
источник