Предположим, что у меня есть переменная, распределение которой искажено положительно в очень высокой степени, так что взятия бревна будет недостаточно, чтобы привести его в диапазон асимметрии для нормального распределения. Какие у меня варианты на данный момент? Что я могу сделать, чтобы преобразовать переменную в нормальное распределение?
data-transformation
skewness
histelheim
источник
источник
Ответы:
Это очень легко реализовать с помощью функции LL, или если у вас есть пакет stat, такой как SAS или MATLAB, используйте их команды: это команда boxcox в MATLAB и PROC TRANSREG в SAS.
Также в R это в пакете MASS, функция boxcox ().
источник
Для положительного перекоса (хвост находится на положительном конце оси x), есть преобразование квадратного корня, логарифмическое преобразование и обратное / обратное преобразование (в порядке возрастания серьезности). Таким образом, если преобразования журнала недостаточно, вы можете использовать следующий уровень преобразования. Box Cox запускает все преобразования автоматически, поэтому вы можете выбрать лучшее.
источник
Большинство пакетов программного обеспечения будет использовать номер Эйлера в качестве базы журналов по умолчанию, AKA: натуральный журнал. Вы можете использовать большее базовое число, чтобы обуздать чрезмерно искаженные данные. То, как вы это делаете, зависит от используемого вами программного обеспечения.
Если вам нужно вернуть преобразованные значения после выполнения оценок, вам может быть немного проще использовать этот метод, потому что все, что вам нужно сделать, - это выполнить экспоненциальный оператор для вашей переменной, какой бы ни была ваша база журналов.
источник