Есть

12

Мой коллега хочет проанализировать некоторые данные после преобразования переменной ответа, подняв ее до степени (то естьу0,125).18y0.125

Мне неудобно с этим, но я не могу понять, почему. Я не могу придумать никакого механистического обоснования для этого преобразования. Также я никогда не видел этого раньше, и я волнуюсь, что, возможно, это раздувает частоту ошибок типа I или что-то в этом роде - но мне нечего поддержать в этом!

Кроме того, мой коллега считает, что эти преобразованные модели превосходят нетрансформированные модели в сравнении с AIC. Оправдывает ли это само по себе его использование?

AndrewMacDonald
источник
9
Просто FYI, выглядит много , как лог ( у ) для многих диапазонов у . Преобразование журнала часто оправдано во многих случаях (но также часто используется и в неоправданных случаях). y1/8log(y)y
Клифф AB
5
Вы не можете осмысленно сравнивать AIC между моделями с преобразованными зависимыми переменными. (Преобразование независимой переменной в порядке.)
Стефан Коласса
5
y=(xp1)/pp
3
Это небольшой риф на идею, что это преобразование может заменить логарифмы, если появляются нули. Логарифмическая связь для обобщенных линейных моделей говорит, что средние ответы изменяются экспоненциально, но не предполагает, что все их значения положительны. Таким образом, он терпит некоторые нули в данных. Грубо говоря, это означает, что они должны или будут положительными, если они могли бы: например, сообщенные нули (ноль образцов в образце, ноль концентраций в соответствии с машиной) иногда означают, что они не обнаружены. Несмотря на свое замечательное название, Box-Cox кажется перепроданным, когда есть естественная связь в GLM.
Ник Кокс

Ответы:

10

Обычной практикой является применение степенных преобразований (Tukey, Box-Cox) с произвольными значениями в ответе. С этой точки зрения я не вижу особой озабоченности относительно вашей ценности 1/8 - если это преобразование даст вам хорошие остатки, сделайте это.

Конечно, любое преобразование изменяет функциональные отношения, которые вам подходят, и может случиться так, что 1/8 не имеет смысла механистически, но это не будет беспокоить меня, когда цель состоит не в том, чтобы экстраполировать или подогнать параметры физического закон, но чтобы получить правильное значение р на знак эффекта (я бы сказал, что это нормальный вариант использования в регрессии). В связи с этим ваша единственная задача состоит в том, чтобы функция соответствовала данным в области значений вашего предиктора (относительно среднего и остаточного отклонения), и это легко проверить.

Если вы не уверены в наилучшем значении для преобразования мощности и хотите сравнить различные варианты, вам не следует напрямую сравнивать значения AIC / вероятности, поскольку преобразование мощности изменяет масштаб ответа. К счастью, оказывается, что вычислить поправку для преобразования относительно просто, так что различные преобразования можно сравнить по их (исправленной) вероятности (см., Например, здесь ).

В R это реализовано в MASS :: boxcox - это удобный способ выбрать правильное значение мощности.

Флориан Хартиг
источник