Вопросы с тегом «skewness»

Асимметрия измеряет (или относится к) степень асимметрии в распределении переменной.

46
Интерпретация логарифмически преобразованного предиктора и / или ответа

Мне интересно, имеет ли это значение при интерпретации того, являются ли логически преобразованными только зависимые, как зависимые, так и независимые, или только независимые переменные. Рассмотрим случай log(DV) = Intercept + B1*IV + Error Я могу интерпретировать IV как процентное увеличение, но...

40
Что стандартное отклонение говорит нам в ненормальном распределении

В нормальном распределении правило 68-95-99.7 придает стандартному отклонению большой смысл, но что будет означать стандартное отклонение в ненормальном распределении (мультимодальное или перекошенное)? Будут ли все значения данных по-прежнему находиться в пределах 3 стандартных отклонений? Есть ли...

31
Может ли кто-нибудь предложить пример унимодального распределения, у которого асимметрия равна нулю, но который не является симметричным?

В мае 2010 года пользователь из Википедии Mcorazao добавил в статью об асимметрии следующее предложение : «Нулевое значение указывает на то, что значения относительно равномерно распределены по обе стороны от среднего значения, обычно, но не обязательно, подразумевая симметричное распределение»....

30
Означает ли среднее = мода симметричное распределение?

Я знаю, что этот вопрос задавался со средним регистром = медианой, но я не нашел ничего, связанного со средним = модой. Если мода равна среднему значению, могу ли я всегда заключить, что это симметричное распределение? Буду ли я вынужден знать также медиану для этого...

29
R: Случайный лес, выбрасывающий NaN / Inf в ошибке «вызова сторонней функции», несмотря на отсутствие NaN в наборе данных [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто 2 года назад . Я использую каретку, чтобы запустить перекрестный проверенный случайный лес по набору данных. Переменная...

24
Обнаружение выбросов на асимметричных распределениях

Согласно классическому определению выброса в качестве точки данных, превышающей 1,5 * IQR из верхнего или нижнего квартиля, существует предположение о неравномерном распределении. Для искаженных распределений (экспоненциальное, пуассоновское, геометрическое и т. Д.) Является наилучшим способом...

23
Как определить, симметрично ли распределение данных?

Я знаю, что если медиана и среднее значение приблизительно равны, то это означает, что существует симметричное распределение, но в данном конкретном случае я не уверен. Среднее значение и медиана довольно близки (разница составляет всего 0,487 м / галл), что заставляет меня сказать, что существует...

23
Как справиться с разницей между распределением тестового набора и обучающего набора?

Я думаю, что одно из основных предположений о машинном обучении или оценке параметров заключается в том, что невидимые данные поступают из того же распределения, что и обучающий набор. Однако в некоторых практических случаях распределение тестового набора будет практически отличаться от учебного...

21
Реальные примеры распределений с отрицательной асимметрией

Вдохновленный « реальными примерами общих распределений », интересно , что педагогические примеры люди используют , чтобы продемонстрировать отрицательную асимметрию? Есть много «канонических» примеров симметричных или нормальных распределений, используемых в обучении - даже если такие, как рост и...

20
Трансформация для увеличения эксцесса и асимметрии нормального течения

Я работаю над алгоритмом, который основан на том факте, что наблюдения s обычно распределяются, и я хотел бы проверить надежность алгоритма в этом предположении эмпирически.YYY Чтобы сделать это, я искал последовательность преобразований , которые постепенно разрушают нормальности . Например, если...

19
Как оценить асимметрию с коробочного участка?

Как определить асимметрию, посмотрев на коробочную диаграмму, построенную из этих данных: 340, 300, 520, 340, 320, 290, 260, 330 Одна книга гласит: «Если нижний квартиль находится дальше от медианы, чем верхний квартиль, то распределение отрицательно искажено». Несколько других источников сказали...

19
Как я могу рассчитать доверительный интервал среднего значения в ненормально распределенной выборке?

Как я могу рассчитать доверительный интервал среднего значения в ненормально распределенной выборке? Я понимаю, что здесь часто используются методы начальной загрузки, но я открыт для других вариантов. В то время как я ищу непараметрическую опцию, если кто-то может убедить меня, что параметрическое...

18
По какой причине преобразование журналов используется с искаженными дистрибутивами?

Я однажды слышал, что логарифмическое преобразование является наиболее популярным для правосторонних распределений в линейной регрессии или квантильной регрессии Я хотел бы знать, есть ли причина, лежащая в основе этого утверждения? Почему преобразование журналов подходит для правильного...

18
t-тест на сильно искаженных данных

У меня есть набор данных с десятками тысяч наблюдений за данными о медицинских расходах. Эти данные сильно искажены вправо и имеют много нулей. Это выглядит так для двух групп людей (в данном случае две возрастные группы с> 3000 человек в каждой): Min. 1st Qu. Median Mean 3rd Qu. Max. 0.0 0.0...

16
Почему искаженные данные не предпочтительны для моделирования?

В большинстве случаев, когда люди говорят о преобразованиях переменных (как для предикторов, так и для переменных ответа), они обсуждают способы обработки асимметрии данных (например, преобразование журнала, преобразование Бокса и Кокса и т. Д.). Я не могу понять, почему устранение асимметрии...

16
Асимметрия логарифма гамма-случайной величины

Рассмотрим гамма случайная величина X∼Γ(α,θ)X∼Γ(α,θ)X\sim\Gamma(\alpha, \theta) . Есть аккуратные формулы для среднего значения, дисперсии и асимметрии: E[X]Var[X]Skewness[X]=αθ=αθ2=1/α⋅E[X]2=2/α−−√E[X]=αθVar⁡[X]=αθ2=1/α⋅E[X]2Skewness⁡[X]=2/α\begin{align} \mathbb E[X]&=\alpha\theta\\...

15
Должен ли я использовать t-тест для сильно искаженных данных? Научное доказательство, пожалуйста?

У меня есть образцы из сильно искаженного (похожего на экспоненциальный дистрибутив) набора данных об участии пользователей (например, количество постов), которые имеют разные размеры (но не менее 200), и я хочу сравнить их среднее значение. Для этого я использую непарные t-тесты с двумя образцами...

14
Способ генерации коррелированных ненормальных данных

Я заинтересован в поиске метода для генерации коррелированных, ненормальных данных. Таким образом, в идеале это некое распределение, которое принимает в качестве параметра ковариационную (или корреляционную) матрицу и генерирует данные, которые приближаются к ней. Но здесь есть одна загвоздка:...

14
Следует ли использовать среднее значение при перекосе данных?

Часто вводные тексты по прикладной статистике отличают среднее от медианного (часто в контексте описательной статистики и мотивации суммирования центральной тенденции с использованием среднего, медианного значения и режима), объясняя, что среднее значение чувствительно к выбросам в данных выборки и...