Предположим, у нас есть процесс Бернулли с вероятностью отказа (который будет мал, скажем, q ≤ 0,01 ), из которого мы производим выборку, пока не встретим 10 отказов. Таким образом , мы оцениваем вероятность отказа , как д : = 10 / N , где N представляет собой число выборок.
Вопрос : Является ли д смещена оценка по д ? И если так, есть ли способ исправить это?
Я обеспокоен тем, что настаивание на последнем примере является ошибочным смещением оценки.
Ответы:
Это правда , что д является предвзятой оценкой ц в том смысле , что E ( Q ) ≠ Q , но вы не обязательно должны позволить этому сдерживать вас. Этот точный сценарий может быть использован в качестве критики против идеи, что мы всегда должны использовать объективные оценки, потому что здесь смещение - это скорее артефакт конкретного эксперимента, который мы проводим. Данные выглядят точно так же, как если бы мы выбрали количество образцов заранее, так почему же наши выводы должны измениться?q^ q E(q^)≠q
Интересно, что если бы вы собирали данные таким образом, а затем записывали функцию правдоподобия как в биномиальной (фиксированный размер выборки), так и в отрицательной биномиальной моделях, вы обнаружили бы, что они пропорциональны друг другу. Это означает , что д является лишь обычной оценкой максимального правдоподобия при отрицательной биномиальной модели, которая, конечно, вполне приемлемая оценка.q^
источник
Он не настаивает на том, что последний образец является ошибкой, которая искажает оценку, он принимает обратную величинуN
Так что в вашем примере, но Е[10E[N10]=1q . Это близко к сравнению среднего арифметического с гармоническим среднимE[10N]≠q
Плохая новость заключается в том, что смещение может увеличиваться с уменьшением , но ненамного, если q уже мало. Хорошей новостью является то, что смещение уменьшается по мере увеличения необходимого количества отказов. Кажется, что если вам требуется f сбоев, то смещение ограничено сверху мультипликативным множителем fq q f для малыхq; Вы не хотите такой подход, когда вы останавливаетесь после первого сбоя ff−1 q
Остановившись после сбоев, при q = 0,01 вы получите E [ N10 q=0.01 но E[10E[N10]=100 , а приq=0,001вы получитеE[NE[10N]≈0.011097 q=0.001 но E[10E[N10]=1000 . Уклон примерно10E[10N]≈0.001111 мультипликативный фактор 109
источник
В качестве дополнения к ответу dsaxton, вот некоторые симуляции в R , показывающие распределение выборки д при к = 10 и д 0 = 0,02 :q^ k=10 q0=0.02
Похоже , что , что является довольно небольшим уклоном по отношению к изменчивости в д .E[q^]≈0.022 q^
источник
10+rnbinom(10000,10,0.02)
10/(10+rnbinom(10000,10,0.02))
. Параметризация определяется количеством успехов / неудач, а не общим количеством испытаний, поэтому вам придется добавить k = 10 обратно. Обратите внимание, что объективная оценка будет на9/(9+rnbinom(10000,10,0.02))
один меньше в числителе и знаменателе.