В рецензии на статью авторы утверждают: «Непрерывные переменные результата, демонстрирующие искаженное распределение, были преобразованы с использованием натуральных логарифмов перед проведением t-тестов для удовлетворения предварительных условий нормальности».
Является ли это приемлемым способом анализа нестандартных данных, особенно если базовое распределение не обязательно является логнормальным?
Это может быть очень глупый вопрос, но я не видел, чтобы это было сделано раньше ....
Ответы:
Обычно пытаются применить какое-то преобразование к нормальности (используя, например, логарифмы, квадратные корни и т. Д.), Когда сталкиваются с данными, которые не являются нормальными. Хотя логарифм дает хорошие результаты для искаженных данных достаточно часто, нет никаких гарантий, что он будет работать в этом конкретном случае. При анализе преобразованных данных следует также иметь в виду приведенный выше комментарий @whubers: «t-критерий для логарифмов - это не то же самое, что t-критерий для нетрансформированных данных и непараметрический критерий. T-критерий в логах сравнивает геометрические означает, а не (обычное) арифметическое средство ".
За преобразованиями в нормальность всегда следует следовать предположению о нормальности, чтобы оценить, выглядят ли преобразованные данные «достаточно нормальными». Это можно сделать, используя, например, гистограммы, QQ-графики и тесты на нормальность. T-критерий особенно чувствителен к отклонениям от нормальности в форме асимметрии, и поэтому тест на нормальность, направленный на альтернативы перекоса, был бы предпочтительным. Образец асимметрии Пирсона является подходящей тестовой статистикой в этом случае.N- 1ΣNя = 1( хя- х¯)3( н- 1ΣNя = 1( хя- х¯)2)3 / 2
Вместо того чтобы выбирать преобразование (например, логарифмы), потому что оно работает большую часть времени, я предпочитаю использовать процедуру Бокса-Кокса для выбора преобразования с использованием заданных данных. Есть, однако, некоторые философские проблемы с этим; в частности, должно ли это влиять на число степеней свободы в t-тесте, так как мы использовали некоторую информацию из выборки при выборе преобразования для использования.
Наконец, хорошей альтернативой использованию t-критерия после преобразования или классического непараметрического критерия является использование аналога начальной загрузки t-критерия. Он не требует предположения о нормальности и является тестом для нетрансформированных средств (и не для чего-либо еще).
источник
Вообще говоря, если предположения, необходимые для проведения t-теста, не выполняются, то было бы более целесообразно использовать непараметрический критерий.
источник