Я слышал / видел в нескольких местах, что вы можете преобразовать набор данных в нечто, что нормально распределено, взяв логарифм каждой выборки, вычислить доверительный интервал для преобразованных данных и преобразовать доверительный интервал обратно, используя обратную операцию (например, поднимите 10 до степени нижней и верхней границ соответственно для ).
Однако я немного подозрительно отношусь к этому методу просто потому, что он не работает для самого среднего значения:
Как правильно это сделать? Если это не работает для самого среднего, как это может работать для доверительного интервала для среднего?
confidence-interval
mean
lognormal
Vegard
источник
источник
Ответы:
Существует несколько способов вычисления доверительных интервалов для среднего логнормального распределения. Я собираюсь представить два метода: Bootstrap и вероятность профиля. Я также представлю обсуждение Джеффриса до.
начальная загрузка
Для MLE
В данном случае ОМП(μ,σ) для образца (x1,...,xn) являются
Затем ОМП среднее равно δ = ехр ( μ + σ 2 / 2 ) . По передискретизации можно получить образец самозагрузки из б и, используя это, мы можем вычислить несколько самозагрузки доверительных интервалов. Следующие коды показывают, как их получить.δ^=exp(μ^+σ^2/2) δ^
R
Для образца означает
Теперь рассмотрим оценкуδ~= х¯ вместо MLE. Можно также рассмотреть другой тип оценщиков.
Вероятность профиля
Для определения функций правдоподобия и профиля правдоподобия см . Используя свойство инвариантности вероятности мы можем reparameterise следующим образом( μ , σ) → ( δ, σ) , где δ= опыт( μ + σ2/ 2) , а затем рассчитать численно профиль вероятности δ .
Эта функция принимает значения в( 0 , 1 ] ; интервал уровня 0,147 имеет приблизительную достоверность 95 % . Мы собираемся использовать это свойство для построения доверительного интервала для δ . В следующих
R
кодах показано, как получить этот интервал.R
Обратите внимание, что они очень похожи.
источник
Вы можете попробовать байесовский подход с Джеффрисом. Это должно привести к доверительным интервалам с правильным свойством соответствия частоте: уровень достоверности интервала достоверности близок к уровню достоверности.
источник
Вы правы - это формула для среднего геометрического, а не среднего арифметического. Среднее арифметическое является параметром нормального распределения и часто не очень значимо для логнормальных данных. Среднее геометрическое является соответствующим параметром из логнормального распределения, если вы хотите более осмысленно говорить о центральной тенденции для ваших данных.
И вы действительно рассчитали бы CI относительно среднего геометрического, взяв логарифмы данных, вычислив среднее значение и CI как обычно, и выполнив обратное преобразование. Вы правы в том, что вы действительно не хотите смешивать свои распределения, помещая CI для среднего геометрического значения вокруг среднего арифметического .... да!
источник