Вопросы с тегом «normality-assumption»

Многие статистические методы предполагают, что данные обычно распределяются. Используйте этот тег для вопросов о допущении и проверке нормальности или о нормальности как * свойство *. Используйте [normal-distribution] для вопросов о нормальном распределении как таковом.

298
Является ли тестирование нормальности «по существу бесполезным»?

Бывший коллега однажды сказал мне следующее: Обычно мы применяем тесты нормальности к результатам процессов, которые при нулевом значении генерируют случайные переменные, которые являются только асимптотически или почти нормальными (с «асимптотически» частью, зависящей от некоторой величины,...

113
Корреляция Пирсона или Спирмена с ненормальными данными

Я получаю этот вопрос достаточно часто в своей статистической консультационной работе, поэтому я решил опубликовать его здесь. У меня есть ответ, который размещен ниже, но мне было интересно услышать, что говорят другие. Вопрос: Если у вас есть две переменные, которые обычно не распределены,...

110
Что если остатки нормально распределены, а у нет?

У меня странный вопрос. Предположим, что у вас есть небольшая выборка, в которой зависимая переменная, которую вы собираетесь анализировать с помощью простой линейной модели, сильно искажена. Таким образом, вы предполагаете, что не является нормально распределенным, потому что это приведет к...

53
Бокс-Кокса как преобразование для независимых переменных?

Существует ли преобразование типа Бокса-Кокса для независимых переменных? То есть преобразование, которое оптимизирует переменную так, чтобы она более подходила для линейной модели?Иксxxy~f(x) Если да, есть ли функция для выполнения этого...

52
ANOVA предположение нормальность / нормальное распределение остатков

На странице Википедии в ANOVA перечислены три предположения , а именно: Независимость случаев - это предположение модели, которая упрощает статистический анализ. Нормальность - распределение остатков нормальное. Равенство (или «однородность») дисперсий, называемых гомоскедастичностью ... Интересным...

52
Почему мы так заботимся о нормально распределенных членах ошибки (и гомоскедастичности) в линейной регрессии, когда нам это не нужно?

Я полагаю, что расстраиваюсь каждый раз, когда слышу, как кто-то говорит, что ненормальность остатков и / или гетероскедастичность нарушают допущения OLS. Для оценки параметров в модели МНК ни одно из этих предположений не является необходимым по теореме Гаусса-Маркова. Я вижу, как это важно в...

47
Интерпретация QQplot - есть ли эмпирическое правило, чтобы принять решение о ненормальности?

Я прочитал достаточно потоков на QQplots здесь, чтобы понять, что QQplot может быть более информативным, чем другие тесты нормальности. Тем не менее, я неопытен в интерпретации QQplots. Я много гуглил; Я нашел много графиков ненормальных QQplots, но нет четких правил, как их интерпретировать, кроме...

47
Если t-критерий и ANOVA для двух групп эквивалентны, почему их предположения не эквивалентны?

Я уверен, что у меня это полностью обернуто вокруг моей головы, но я просто не могу понять это. T-критерий сравнивает два нормальных распределения, используя Z-распределение. Вот почему в ДАННЫХ есть предположение о нормальности. ANOVA эквивалентен линейной регрессии с фиктивными переменными и...

46
Нормализация против масштабирования

В чем разница между данными «нормализация» и данными «масштабирование»? До сих пор я думал, что оба термина относятся к одному и тому же процессу, но теперь я понимаю, что есть нечто большее, чего я не знаю / не понимаю. Также, если есть разница между нормализацией и масштабированием, когда мы...

45
Регрессия, когда остатки OLS обычно не распределяются

На этом сайте есть несколько потоков, обсуждающих, как определить, асимптотически ли нормально распределены остатки OLS . В этом превосходном ответе представлен другой способ оценки нормальности остатков с помощью R-кода . Это еще одно обсуждение практической разницы между стандартизированными и...

45
Как выполнить тест с использованием R, чтобы проверить, соответствуют ли данные нормальному распределению

У меня есть набор данных со следующей структурой: a word | number of occurrence of a word in a document | a document id Как я могу выполнить тест для нормального распределения в R? Возможно, это простой вопрос, но я новичок в...

43
Какие ссылки следует привести, чтобы использовать 30 как достаточно большой размер выборки?

Я много раз читал / слышал, что размер выборки, по крайней мере, 30 единиц, считается «большой выборкой» (предположения о нормальности средств обычно приблизительно соответствуют CLT, ...). Поэтому в своих экспериментах я обычно генерирую образцы по 30 единиц. Можете ли вы дать мне некоторые...

34
Нормальность зависимой переменной = нормальность остатков?

Эта проблема, кажется, постоянно поднимает свою уродливую голову, и я пытаюсь обезглавить ее для моего собственного понимания статистики (и здравомыслия!). Допущения общих линейных моделей (t-критерий, ANOVA, регрессия и т. Д.) Включают «допущение нормальности», но я обнаружил, что это редко...

30
В чем разница между критерием нормальности Шапиро-Уилка и критерием нормальности Колмогорова-Смирнова?

В чем разница между критерием нормальности Шапиро-Уилка и критерием нормальности Колмогорова-Смирнова? Когда результаты этих двух методов будут

29
Интерпретация теста Шапиро-Вилка

Я довольно плохо знаком со статистикой, и мне нужна ваша помощь. У меня есть небольшой образец, как показано ниже: H4U 0.269 0.357 0.2 0.221 0.275 0.277 0.253 0.127 0.246 Я выполнил тест Шапиро-Уилка, используя R: shapiro.test(precisionH4U$H4U) и я получил следующий результат: W = 0.9502, p-value =...

29
Есть ли объяснение тому, почему существует так много природных явлений, которые следуют нормальному распределению?

Я думаю, что это увлекательная тема, и я не до конца ее понимаю. Какой закон физики делает так, чтобы у многих природных явлений было нормальное распределение? Казалось бы, более интуитивно понятно, что они будут иметь равномерное распределение. Мне так трудно это понять, и я чувствую, что мне не...

28
Насколько некорректна модель регрессии, когда предположения не выполняются?

При подборе регрессионной модели, что произойдет, если предположения о выходных данных не будут выполнены, а именно Что произойдет, если остатки не будут гомоскедастичными? Если остатки показывают растущий или убывающий паттерн на графике Остатки против Приспособленного. Что произойдет, если...

28
Вычисление повторяемости эффектов по модели Лмера

Я только что наткнулся на эту статью , в которой описывается, как вычислить повторяемость (или надежность, или внутриклассовую корреляцию) измерения с помощью моделирования смешанных эффектов. Код R будет: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc =...