Мне было интересно, может ли кто-нибудь помочь мне с информацией о куртозе (т.е. есть ли способ преобразовать ваши данные, чтобы уменьшить его?)
У меня есть набор данных анкеты с большим количеством случаев и переменных. Для некоторых из моих переменных данные показывают довольно высокие значения эксцесса (то есть, распределение лептокуртов), что вытекает из того факта, что многие участники дали одинаковую оценку для переменной. У меня очень большой размер выборки, поэтому, согласно центральной предельной теореме, нарушения нормальности все равно должны быть в порядке.
Проблема, однако, заключается в том факте, что особенно высокие уровни куртоза приводят к ряду одномерных выбросов в моем наборе данных. Таким образом, даже если я преобразую данные или удаляю / корректирую выбросы, высокие уровни эксцессов означают, что следующие наиболее экстремальные показатели автоматически становятся выбросами. Я стремлюсь использовать (анализ дискриминантной функции). Считается, что DFA устойчив к отклонениям от нормы при условии, что нарушение вызвано асимметрией, а не выбросами. Кроме того, на DFA также, как говорят, особенно влияют выбросы в данных (Tabachnick & Fidel).
Есть идеи как обойти это? (Моя первоначальная мысль была о том, как контролировать куртоз, но разве это не хорошо, если большая часть моей выборки дает аналогичные оценки?)