Для некоторых измерений результаты анализа соответствующим образом представлены в преобразованной шкале. Однако в большинстве случаев желательно представлять результаты в исходной шкале измерений (в противном случае ваша работа более или менее бесполезна).
Например, в случае данных, преобразованных в лог, возникает проблема с интерпретацией в исходной шкале, потому что среднее значение зарегистрированных значений не является логарифмом среднего. Взятие антилогарифма оценки среднего значения по логарифмической шкале не дает оценки среднего значения по исходной шкале.
Однако, если преобразованные в журнал данные имеют симметричное распределение, сохраняются следующие отношения (поскольку журнал сохраняет порядок):
(антилогарифм среднего значения логарифма является медианой на исходной шкале измерений).
Так что я могу только сделать выводы о разнице (или соотношении) медиан в исходной шкале измерения.
T-тесты с двумя выборками и доверительные интервалы наиболее надежны, если популяции примерно нормальны с приблизительно стандартными отклонениями, поэтому мы можем испытать искушение использовать Box-Cox
преобразование для выполнения предположения о нормальности (я также думаю, что это преобразование также стабилизирует дисперсию) ).
Однако, если мы применим t-инструменты к Box-Cox
преобразованным данным, мы получим выводы о разнице в средствах преобразованных данных. Как мы можем интерпретировать те, которые находятся на первоначальной шкале измерения? (Среднее из преобразованных значений не является преобразованным средним). Другими словами, выполнение обратного преобразования оценки среднего значения в преобразованной шкале не дает оценку среднего значения в исходной шкале.
Могу ли я также сделать выводы только о медианах в этом случае? Есть ли трансформация, которая позволит мне вернуться к средствам (в первоначальном масштабе)?
Этот вопрос был изначально размещен как комментарий здесь
источник
Если преобразование Бокса-Кокса дает симметричное распределение, то среднее значение преобразованных данных преобразуется обратно в медиану в исходном масштабе. Это верно для любого монотонного преобразования, включая преобразования Бокса-Кокса, преобразования IHS и т. Д. Таким образом, выводы о средстве для преобразованных данных соответствуют выводам о медиане в исходной шкале.
Поскольку исходные данные были искажены (или вы не использовали бы вначале преобразование Бокса-Кокса), зачем вам выводы о средствах? Я бы подумал, что работа с медианами будет иметь больше смысла в этой ситуации. Я не понимаю, почему это рассматривается как «проблема с интерпретацией в первоначальном масштабе».
источник
Если вы хотите сделать вывод о средствах в исходной шкале, вы можете рассмотреть возможность использования вывода, которое не использует допущения нормальности.
Будьте осторожны, однако. Простое включение прямого сравнения средних значений посредством, скажем, повторной выборки (либо тестов перестановки, либо начальной загрузки), когда две выборки имеют разные отклонения, может стать проблемой, если ваш анализ предполагает, что отклонения равны (и равные отклонения в преобразованной шкале будут разностными отклонениями). в первоначальном масштабе, если средства отличаются). Такие техники не избавляют от необходимости думать о том, что вы делаете.
-
Самый простой случай - это нормальность в логарифмическом масштабе и, следовательно, логарифмическая норма в исходном масштабе. Если ваша дисперсия известна (что в лучшем случае случается очень редко), вы можете построить логарифмические КИ и ПИ по исходной шкале, и вы можете дать прогнозируемое среднее из среднего значения распределения соответствующей величины.
Вы должны очень тщательно продумать, на какой именно вопрос вы пытаетесь ответить.
источник