Оценка максимального правдоподобия для минимума экспоненциальных распределений

10

Я застрял на том, как решить эту проблему.

Итак, у нас есть две последовательности случайных величин: и для . Теперь и являются независимыми экспоненциальными распределениями с параметрами и . Однако, вместо того, чтобы наблюдать и , мы видим вместо и .Y я я = 1 , . , , , n X Y λ μ X Y Z WXiYii=1,...,nXYλμXYZW

Z=min(Xi,Yi) и W=1 если Zi=Xi и 0, если Zi=Yi . Я должен найти закрытые формы для максимального правдоподобия оценок λ и μ на основе Z и W . Далее нам нужно показать, что это глобальные максимумы.

Теперь я знаю, что минимум двух независимых экспонент сам по себе экспоненциальный со скоростью, равной сумме скоростей, поэтому мы знаем, что Z экспоненциально с параметром λ+μ . Таким образом, наша оценка максимального правдоподобия: λ^+μ^=Z¯ .

Но я застрял с тем, куда идти отсюда. Я знаю, что W - это распределение Бернулли с параметром p=P(Zi=Xi) , но я не знаю, как преобразовать это в утверждение об одном из параметров. Например, что бы MLE W¯ оценивал в терминах λ и / или μ ? Я понимаю, что если Zi=Xi , то μ=0 , но мне трудно разобраться, как придумать какое-либо алгебраическое утверждение, здесь.

UPDATE 1: Так что я сказал в комментариях , чтобы получить вероятность для совместного распределения Z и W .

Таким образом, где . Правильный? Я не знаю, как еще получить совместное распределение в этом случае, так как и не являются независимыми.p = P ( Z i = X i ) Z Wf(Z,W)=f(Z|W=1)p+f(Z|W=0)(1p)p=P(Zi=Xi)ZW

Так что это дает нам, , по определению выше. Но что теперь? Это никуда меня не приведет. Если я пройду шаги по вычислению вероятности, я получу: (используя и в качестве размеров выборки для каждой части смеси ...) W m nf(Zi,Wi)=pλeλzi+(1p)μeμziWmn

L(λ,μ)=pmλmeλzi+(1p)nμneμzi

logL=mlogp+mlogλλzi+nlog(1p)+nlogμμzi

Если взять частные производные, это говорит мне , что оценивает мой MLE для и только среднее значение «s условном на . Это,μ Z WλμZW

λ^=Zim

μ^=Zin

а также

p^=mn+m

Райан Симмонс
источник
1
Только что ответив на аналогичный вопрос MLE сегодня, могу ли я направить вас к этому решению для некоторых идей? Связь между вопросами такова, что ваши данные также естественно разбиваются на две непересекающиеся группы: те, где и те, где . Все сводится к записи вероятности наблюдения вида ; симметрия между и , и , сразу же создает вероятность для данных в форме и вы начинаете работать. W = 1 ( Z , W ) = ( z , 0 ) X Y μ λ ( z , 1 )W=0W=1(Z,W)=(z,0)XYμλ(z,1)
whuber
Не спешите писать с максимальной вероятностью! Сначала выразите совместное распределение , затем определите вероятность, связанную с выборкой , которая оказывается замкнутой благодаря экспоненциальному предположению. Тогда и только тогда вы можете попытаться максимизировать функцию и, следовательно, получить максимальную вероятность. ( Z i , W ) = i )(Z,W)(Zi,W)=i)
Сиань
@whuber: (+1) это действительно довольно просто и включает в себя разделение между и но обе группы включают в себя как и , так как они приносят информацию как в и , так как . ( z i , 0 ) μ λ X i Y i W i = I ( X i < Y i )(zi,1)(zi,0) μλ XiYiWi=I(Xi<Yi)
Сиань
2
@ Xi'an Это верно - и параллели с примером из теории норм, на который я ссылаюсь, чтобы продолжить, потому что там обе группы предоставляют информацию об общем параметре (шкала), оценка которого, таким образом, будет включать «объединение» данных из групп. Здесь будет видно, что говорит нам, как оценка (скорость или обратная шкала для ) должна быть разделена на отдельные оценки и . ˉ W λ + μ Z λ μσW¯λ+μZλμ
whuber
Я прочитал другую ветку, но я, честно говоря, не понимаю, как применить это к этому примеру. Z и W не являются независимыми, так как я могу получить совместное распределение?
Райан Симмонс

Ответы:

1

У меня недостаточно очков, чтобы комментировать, поэтому я напишу здесь. Я думаю, что проблема, которую вы публикуете, может быть рассмотрена с точки зрения анализа выживания, если учесть следующее:

Xi : истинное время выживания,

Yi : время ,

Оба имеют экспоненциальное распределение с независимыми иТогда - это наблюдаемое время выживания, а - показатель цензуры.Y Z я W яXYZiWi

Если вы знакомы с анализом выживания, я думаю, вы можете начать с этого момента.

Примечания: Хороший источник: анализ данных выживания DRCox и D.Oakes

Ниже приведен пример: Предполагается, что pdf распределения времени выживания . Тогда функция выживания: . И логарифмическая вероятность: S ( t ) = e - ρ tf(t)=ρeρtS(t)=eρt

l=ulogf(zi)+clogS(zi)

с суммированием по цензуре ( ) и цензуре ( ) соответственно.сuc

В связи с тем, что где h (t) - функция опасности, это можно записать так:f(t)=h(t)S(t)

l=ulogh(zi)+logS(zi)

l=ulogρρzi

И максимальная оценка правдоподобия of : рρ^ρ

дШя=1ρ^=d/zi где - общее количество случаевdWi=1

jujae
источник