Я наблюдаю время обработки процесса до и после изменения, чтобы выяснить, улучшился ли процесс в результате изменения. Процесс улучшился, если время обработки сократилось. Распределение времени обработки жирнохвостое, поэтому сравнение по среднему показателю нецелесообразно. Вместо этого я хотел бы знать, значительно ли вероятность наблюдать меньшее время обработки после изменения выше 50%.
Пусть будет случайной величиной для времени обработки после изменения, а Y - предыдущей. Если P ( X < Y ) значительно выше 0,5, то я бы сказал, что процесс улучшился.
Теперь у меня есть наблюдений х I из X и м наблюдений у J из Y . Наблюдаемая вероятность P ( X < Y ) является р = 1.
Что я могу сказать о учитывая наблюдения x i и y j ?
источник
@jbowman предоставляет (хорошее) стандартное решение задачи оценки которая известна как модель прочности при напряжении .θ = P( Х< Y)
Другая непараметрическая альтернатива была предложена в Baklizi and Eidous (2006) для случая, когда и Y независимы. Это описано ниже.Икс Y
По определению имеем
где представляет ВПР из X и F Y представляет собой плотность Y . Затем, используя образцы X и Y можно получить ядро оценок из F X и F Y и , следовательно , и оценку & thetasFИкс Икс еY Y Икс Y FИкс еY θ
Это реализовано в следующем коде R с использованием ядра Гаусса.
Другие виды интервалов начальной загрузки также могут быть рассмотрены.
источник
источник