Обратно преобразованные доверительные интервалы

11

Столкнувшись с этим обсуждением, я поднимаю вопрос о конвенциях с обратным преобразованием доверительных интервалов.

В соответствии с этой статьей номинальное покрытие обратного преобразования КИ для среднего значения логнормальной случайной величины составляет:

 UCL(X)=exp(Y+var(Y)2+zvar(Y)n+var(Y)22(n1))  LCL(X)=exp(Y+var(Y)2zvar(Y)n+var(Y)22(n1))

/ а не наивный /exp((Y)+zvar(Y))

Теперь, что такое такие КИ для следующих преобразований:

  1. x иx1/3
  2. arcsin(x)
  3. log(x1x)
  4. 1/x

Как насчет интервала допуска для самой случайной величины (я имею в виду одно значение выборки, случайно взятое из совокупности)? Есть ли такая же проблема с обратно преобразованными интервалами, или они будут иметь номинальное покрытие?

Germaniawerks
источник
1
См. Разложение Тейлора для моментов функций rvs и метод Дельта . Но нужна осторожность. Смотрите пример обсуждения здесь и [здесь] (stats.stackexchange.com/questions/41896/varx-is-known-how-to-calculate-var1-x/). Поиск по серии Тейлор представит несколько полезных примеров и обсуждений.
Glen_b
Я внес существенные изменения в ваши формулы. Пожалуйста, проверьте, что я не понял ни одного из них неправильно. В моем предыдущем комментарии (извините за неправильно отформатированную ссылку там) - также см.
Предупредительный
Спасибо. Хотя я вряд ли смогу опубликовать что-либо без редактирования с такими причудливыми выражениями.
Germaniawerks

Ответы:

6

Почему вы делаете обратные преобразования вообще? Очень важно ответить на ваш вопрос, потому что в некоторых случаях наивное преобразование является правильным ответом. На самом деле, я думаю, что я буду утверждать, что, если наивное обратное преобразование не является правильным ответом, то вам не следует возвращать обратное преобразование вообще.

Я считаю, что общая проблема трансформации спины весьма проблематична и часто полна запутанного мышления. Глядя на статью, которую вы цитировали, что заставляет их думать, что это разумный вопрос, что обратно преобразованный CI не отражает первоначальное среднее значение? Это ошибочная интерпретация обратно преобразованных ценностей. Они думают, что охват должен быть для прямого анализа в обратно трансформированном пространстве. И затем они создают обратное преобразование, чтобы исправить эту ошибку вместо их интерпретации.

Если вы выполняете анализ значений журнала, то ваши оценки и выводы применяются к этим значениям журнала. До тех пор, пока вы рассматриваете любое обратное преобразование представления о том, как этот анализ логов выглядит в экспоненциальном пространстве, и только так, тогда вы в порядке с наивным подходом. На самом деле это точно. Это верно для любого преобразования.

То, что они делают, решает проблему превращения КИ в нечто, чем оно не является, КИ преобразованных значений. Это чревато проблемами. Рассмотрим привязку, в которой вы сейчас находитесь, два возможных КИ, один в преобразованном пространстве, где вы проводите анализ, а другой обратно преобразованный, делают совершенно разные заявления о том, где вероятный му находится в другом пространстве. Рекомендуемое обратное преобразование создает больше проблем, чем решает.

Лучшее, что можно извлечь из этого документа, это то, что когда вы решите преобразовать данные, это окажет более глубокое влияние, чем ожидалось, на значение ваших оценок и выводов.

Джон
источник
Не могли бы вы объяснить это дальше? Мне кажется, проблема в том, что наивный КИ дает среднее геометрическое, а не арифметическое. Что и подразумевает, что он будет строго меньше, как говорится, и, следовательно, непоследовательность и плохой охват.
Germaniawerks
Несоответствие с чем? Если вы собираетесь анализировать свое экспоненциальное распределение напрямую и хотите знать среднее арифметическое, тогда да, это плохой охват для этого. Но если вы хотели это сделать, то вам следовало сделать это. Если вы собираетесь регистрировать, преобразовывать свой дистрибутив и анализировать показатели, то это как раз то, что нужно для этого.
Джон
Я не могу понять, почему вы возражаете против метода в статье. Моделирование показывает, что оно работает нормально, в то время как наивный метод работает хуже, чем «центрально-предельный подход».
Germaniawerks
1
Они показывают, что это делает лучше для того, что они хотят, чтобы это было. Наивный метод прекрасно работает для того, что он есть. Посмотрите на моделирование в разделе 5. Они устанавливают среднее значение распределения 5, которое имеет показатель степени 148,4. Затем они продолжают обсуждать охват среднего 244,6! Это было бы важно, только если вы собираетесь смоделировать среднее значение исходного дистрибутива, а НЕ логи. Они пытаются сделать что-то, что это не так. Наивный расчет имеет совершенно точное покрытие по среднему значению журнала, 5. Ни один из других КИ не является 95% КИ этого значения, и это тот, который вы анализируете.
Джон