Вопросы с тегом «regression»

15
LASSO / LARS против общего к специфическому (GETS) методу

Мне было интересно, почему методы выбора моделей LASSO и LARS так популярны, даже если они в основном представляют собой просто варианты пошагового прямого выбора (и, следовательно, страдают от зависимости пути)? Точно так же, почему методы General to Specific (GETS) для выбора модели в основном...

15
Как выбрать между различными скорректированными формулами ?

Я имею в виду скорректированные формулы R-квадрата, предложенные: Иезекииль (1930), который, как мне кажется, в настоящее время используется в SPSS. R2adjusted=1−(N−1)(N−p−1)(1−R2)Radjusted2=1−(N−1)(N−p−1)(1−R2)R^2_{\rm adjusted} = 1 - \frac{(N-1)}{(N-p-1)} (1-R^2) Олкин и Пратт (1958) р2у п б я ы...

15
Множественная линейная регрессия для проверки гипотез

Я знаком с использованием нескольких линейных регрессий для создания моделей различных переменных. Однако мне было любопытно, используются ли когда-либо регрессионные тесты для проверки каких-либо базовых гипотез. Если да, то как будут выглядеть эти сценарии /...

15
Почему оценки коэффициента регрессии rlm () отличаются от lm () в R?

Я использую rlm в пакете R MASS для регрессии многомерной линейной модели. Это хорошо работает для ряда образцов, но я получаю квазинулевые коэффициенты для конкретной модели: Call: rlm(formula = Y ~ X1 + X2 + X3 + X4, data = mymodel, maxit = 50, na.action = na.omit) Residuals: Min 1Q Median 3Q Max...

15
Автоматизированная процедура выбора подмножества точек данных с сильнейшей корреляцией?

Существует ли какая-либо стандартная процедура (такая, чтобы ее можно было назвать в качестве справочной) для выбора подмножества точек данных из большего пула с самой сильной корреляцией (только по двум измерениям)? Например, скажем, у вас есть 100 точек данных. Вам нужно подмножество из 40 точек...

15
Либо квадратичный, либо член взаимодействия важен в изоляции, но ни один из них не вместе

В рамках задания мне нужно было дополнить модель двумя переменными предикторами. Затем мне пришлось нарисовать график остатков моделей по отношению к одному из включенных предикторов и внести изменения на основе этого. График показал криволинейную тенденцию, и поэтому я включил квадратный термин...

15
Регрессия ошибок в переменных: допустимо ли объединение данных с трех сайтов?

Недавно ко мне пришел клиент, чтобы выполнить анализ начальной загрузки, потому что рецензент FDA сказал, что их регрессия ошибок в переменных была недействительной, потому что при объединении данных с сайтов анализ включал объединение данных с трех сайтов, где два сайта включали некоторые выборки,...

15
Случайный лес переоснащается

Я пытаюсь использовать случайную лесную регрессию в scikits-learn. Проблема в том, что я получаю очень высокую ошибку теста: train MSE, 4.64, test MSE: 252.25. Вот как выглядят мои данные: (синий: реальные данные, зеленый: прогноз): Я использую 90% для обучения и 10% для тестирования. Это код,...

15
Как ggplot вычисляет доверительные интервалы для регрессий?

Пакет построения графиков R ggplot2 имеет потрясающую функцию stat_smooth для построения линии регрессии (или кривой) с соответствующей доверительной полосой. Однако мне трудно понять, как именно генерируется этот доверительный интервал для каждого времени линии регрессии (или «метода»). Как я могу...

15
Как сделать регрессию с кодированием эффекта вместо фиктивного кодирования в R?

В настоящее время я работаю над регрессионной моделью, в которой у меня есть только категориальные / факторные переменные в качестве независимых переменных. Моя зависимая переменная является логит-преобразованным коэффициентом. Довольно просто запустить нормальную регрессию в R, так как R...

15
Почему скорректированный R-квадрат меньше, чем R-квадрат, если скорректированный R-квадрат лучше предсказывает модель?

Насколько я понимаю, объясняет, насколько хорошо модель предсказывает наблюдение. Скорректированный - это тот, который учитывает больше наблюдений (или степеней свободы). Итак, Скорректированный предсказывает модель лучше? Тогда почему это меньше, чем ? Похоже, что часто должно быть...

15
Как интерпретировать коэффициенты из бета-регрессии?

У меня есть некоторые данные, которые ограничены между 0 и 1. Я использовал betaregпакет в R, чтобы подогнать регрессионную модель с ограниченными данными в качестве зависимой переменной. У меня вопрос: как мне интерпретировать коэффициенты из...

15
Точное значение и сравнение между влиятельной точкой, точкой высокого плеча и выбросом?

Из Википедии Влиятельные наблюдения - это те наблюдения, которые относительно сильно влияют на прогнозы регрессионной модели. Из Википедии Точки воздействия - это те наблюдения, если таковые имеются, сделанные при экстремальных или внешних значениях независимых переменных, так что отсутствие...

15
Лучший способ визуально представить отношения из множественной линейной модели

У меня есть линейная модель с примерно 6 предикторами, и я собираюсь представить оценки, значения F, значения p и т. Д. Однако мне было интересно, какой будет лучший визуальный график для представления отдельного влияния одного предиктора на переменная ответа? Разброс точек? Условный участок?...

15
Как выполнить регрессию для ненормальных данных, которые остаются ненормальными при преобразовании?

У меня есть некоторые данные (158 случаев), которые были получены из ответа по шкале Лайкерта на 21 вопросник. Я действительно хочу / нужно провести регрессионный анализ, чтобы увидеть, какие пункты в анкете предсказывают реакцию на общий элемент (удовлетворенность). Ответы обычно не распределяются...

15
Какова интуиция за сменными образцами при нулевой гипотезе?

Тесты перестановки (также называемые тестом рандомизации, тестом повторной рандомизации или точным тестом) очень полезны и оказываются полезными, когда предположение о нормальном распределении, требуемое, например, t-testне выполняется, и когда преобразование значений путем ранжирования...

15
Как добиться строго позитивных прогнозов?

Я работаю над временным рядом, значения которого строго положительны . Работая с различными моделями, включая AR, MA, ARMA и т. Д., Я не мог найти простой способ добиться строго положительных прогнозов. Я использую R для выполнения своих прогнозов, и все, что я смог найти, это прогноз.hts {hts}, у...

15
Подводные камни, которых следует избегать при преобразовании данных?

Я добился прочной линейной взаимосвязи между моей переменной XXX и YYY после двукратного преобразования ответа. Модель была Y∼XY∼XY\sim X но я преобразовал ее в YX−−√∼X−−√YX∼X\sqrt{\frac{Y}{X}}\sim \sqrt{X} улучшилR2R2R^2с .19 до .76. Очевидно, я сделал приличную операцию на этих отношениях. Может...

15
Что значит объяснить дисперсию?

В частности, мне интересно, почему у нас есть концепция множественного R (которую я могу понять как корреляция между наблюдаемыми и прогнозируемыми оценками при множественной регрессии), а затем отдельное понятие R-квадрат, представляющее собой просто квадрат или R. Мне сообщили, что R-квадрат -...