Вопросы с тегом «assumptions»

Относится к условиям, при которых процедура статистики дает действительные оценки и / или выводы. Например, многие статистические методы требуют допущения, что данные каким-то образом выбираются случайным образом. Теоретические результаты об оценках обычно требуют предположений о механизме генерирования данных.

72
Каков полный список обычных предположений для линейной регрессии?

Каковы обычные предположения для линейной регрессии? Они включают в себя: линейная зависимость между независимой и зависимой переменной независимые ошибки нормальное распределение ошибок гомоскедастичность Есть ли...

71
Генерация случайной величины с определенной корреляцией с существующей переменной

Для исследования моделирования я должен генерировать случайные переменные , которые показывают prefined (населения) корреляцию с существующей переменной .YYY Я посмотрел на Rпакеты copulaи CDVineкоторые могут производить случайные многомерные распределения с заданной структурой зависимостей. Однако...

71
Существует ли минимальный размер выборки, необходимый для того, чтобы t-тест был действительным?

В настоящее время я работаю над квази-экспериментальной исследовательской работой. У меня размер выборки только 15 из-за низкой численности населения в выбранной области, и только 15 соответствуют моим критериям. Является ли 15 минимальным размером выборки для t-теста и F-теста? Если так, где я...

52
Почему мы так заботимся о нормально распределенных членах ошибки (и гомоскедастичности) в линейной регрессии, когда нам это не нужно?

Я полагаю, что расстраиваюсь каждый раз, когда слышу, как кто-то говорит, что ненормальность остатков и / или гетероскедастичность нарушают допущения OLS. Для оценки параметров в модели МНК ни одно из этих предположений не является необходимым по теореме Гаусса-Маркова. Я вижу, как это важно в...

52
ANOVA предположение нормальность / нормальное распределение остатков

На странице Википедии в ANOVA перечислены три предположения , а именно: Независимость случаев - это предположение модели, которая упрощает статистический анализ. Нормальность - распределение остатков нормальное. Равенство (или «однородность») дисперсий, называемых гомоскедастичностью ... Интересным...

45
Регрессия, когда остатки OLS обычно не распределяются

На этом сайте есть несколько потоков, обсуждающих, как определить, асимптотически ли нормально распределены остатки OLS . В этом превосходном ответе представлен другой способ оценки нормальности остатков с помощью R-кода . Это еще одно обсуждение практической разницы между стандартизированными и...

36
Почему время выживания считается экспоненциально распределенным?

Из этого поста я изучаю анализ выживания в UCLA IDRE, и меня обвинили в разделе 1.2.1. Учебник говорит: ... если было известно, что времена выживания экспоненциально распределены , то вероятность наблюдения времени выживания ... Почему время выживания считается экспоненциально распределенным? Это...

34
Интерпретация графика невязок и подгоночных значений для проверки предположений линейной модели

Рассмотрим следующую фигуру из линейных моделей Faraway с R (2005, стр. 59). Первый график, по-видимому, указывает на то, что остатки и подогнанные значения некоррелированы, поскольку они должны быть в гомоскедастической линейной модели с нормально распределенными ошибками. Поэтому второй и третий...

30
Каковы предположения об отрицательной биномиальной регрессии?

Этот вопрос был перенесен из Математического стека обмена, потому что на него можно ответить по перекрестной проверке. Мигрировал 6 лет назад . Я работаю с большим набором данных (конфиденциально, поэтому я не могу поделиться слишком много), и пришел к выводу, что отрицательный биномиальный...

30
Являются ли 50% доверительные интервалы более достоверными, чем 95% доверительные интервалы?

Мой вопрос вытекает из этого комментария к сообщению в блоге Эндрю Гельмана, в котором он выступает за использование 50% -ных доверительных интервалов вместо 95% -ных доверительных интервалов, хотя не на том основании, что они более надежно оценены: Я предпочитаю интервалы от 50% до 95% по 3...

28
Насколько некорректна модель регрессии, когда предположения не выполняются?

При подборе регрессионной модели, что произойдет, если предположения о выходных данных не будут выполнены, а именно Что произойдет, если остатки не будут гомоскедастичными? Если остатки показывают растущий или убывающий паттерн на графике Остатки против Приспособленного. Что произойдет, если...

28
Что означает «независимые наблюдения»?

Я пытаюсь понять, что означает предположение о независимых наблюдениях . Некоторые определения: «Два события независимы тогда и только тогда, когда ». ( Словарь статистических терминов )P(a∩b)=P(a)∗P(b)P(a∩b)=P(a)∗P(b)P(a \cap b) = P(a) * P(b) «возникновение одного события не меняет вероятность...

28
Каковы опасности нарушения предположения о гомоскедастичности для линейной регрессии?

В качестве примера рассмотрим ChickWeightнабор данных в R. Разница, очевидно, со временем увеличивается, поэтому, если я использую простую линейную регрессию, например: m <- lm(weight ~ Time*Diet, data=ChickWeight) Мои вопросы: Какие аспекты модели будут сомнительными? Проблемы ограничены...

27
Что я должен проверить на нормальность: необработанные данные или остатки?

Я узнал, что должен проверять нормальность не на необработанных данных, а на их остатках. Должен ли я рассчитать невязки, а затем пройти тест Шапиро – Вилка? Рассчитываются остатки как: ?Xi−meanXi−meanX_i - \text{mean} Пожалуйста, посмотрите этот предыдущий вопрос для моих данных и...

26
Можно ли распространить критерий Мантеля на асимметричные матрицы?

Тест Мантеля обычно применяется к симметричным матрицам расстояний / разностей. Насколько я понимаю, предположение теста состоит в том, что мера, используемая для определения различий, должна быть, по крайней мере, полуметрической (соответствовать стандартным требованиям метрики, но не неравенству...

26
Размер выборки для логистической регрессии?

Я хочу сделать логистическую модель из моих данных опроса. Это небольшой опрос четырех жилых колоний, в котором было опрошено только 154 респондента. Моя зависимая переменная - «удовлетворительный переход к работе». Я обнаружил, что из 154 респондентов 73 сказали, что они успешно перешли на работу,...

25
Проверка предположений смешанных моделей lmer / lme в R

Я выполнил повторный проект, в ходе которого я протестировал 30 мужчин и 30 женщин в трех разных заданиях. Я хочу понять, как поведение мужчин и женщин отличается и как это зависит от задачи. Я использовал оба пакета lmer и lme4, чтобы исследовать это, однако я застрял при попытке проверить...

24
Насколько надежен независимый выборочный t-критерий, когда распределение образцов ненормальное?

Я читал, что t- тест является «достаточно надежным», когда распределение выборок отклоняется от нормального. Конечно, важны именно выборочные распределения различий. У меня есть данные для двух групп. Одна из групп сильно отклонена от зависимой переменной. Размер выборки довольно мал для обеих...

22
Допущения о линейных моделях и что делать, если остатки не распределены нормально

Я немного запутался в предположениях о линейной регрессии. До сих пор я проверял: все объясняющие переменные линейно коррелировали с переменной отклика. (Это было так) была какая-то коллинеарность среди объясняющих переменных. (была небольшая коллинеарность). расстояния Кука точек данных моей...

21
Каковы предположения о регрессии гребня и как их проверить?

Рассмотрим стандартную модель множественной регрессии где , так что нормальность, гомоскедастичность и некоррелированность ошибок сохраняются.Y= Xβ+ εY=Xβ+εY=X\beta+\varepsilonε ∼ N( 0 , σ2яN)ε∼N(0,σ2In)\varepsilon \sim \mathcal N(0, \sigma^2I_n) Предположим, что мы выполняем регрессию гребня,...