Вопросы с тегом «regression»

29
Как стандартные ошибки вычисляются для подобранных значений из логистической регрессии?

Когда вы прогнозируете подходящее значение из модели логистической регрессии, как рассчитываются стандартные ошибки? Я имею в виду для подогнанных значений , а не для коэффициентов (которые включают информационную матрицу Фишера). Я только узнал, как получить числа R(например, здесь, в r-help, или...

29
Доказательство того, что коэффициенты в модели OLS следуют t-распределению с (nk) степенями свободы

Задний план Предположим, у нас есть модель Обыкновенных наименьших квадратов, в которой у нас есть коэффициентов в нашей регрессионной модели, kkky=Xβ+ϵy=Xβ+ϵ\mathbf{y}=\mathbf{X}\mathbf{\beta} + \mathbf{\epsilon} где - вектор коэффициентов, - матрица проектирования, определяемая...

29
Как работать с иерархическими / вложенными данными в машинном обучении

Я объясню мою проблему на примере. Предположим, вы хотите предсказать доход человека с учетом некоторых атрибутов: {Возраст, Пол, Страна, Регион, Город}. У вас есть тренировочный набор данных, как так train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4,...

29
Регресс к среднему значению против заблуждения игрока

С одной стороны, у меня есть регресс к среднему значению, а с другой - у меня ошибка игрока . Ошибка Игрока определяется Миллером и Санджурджо (2019) как «ошибочное убеждение, что случайные последовательности имеют систематическую тенденцию к развороту, то есть, что полосы схожих результатов скорее...

29
Полиномиальная регрессия с использованием scikit-learn

Я пытаюсь использовать scikit-learn для полиномиальной регрессии. Из того, что я прочитал, полиномиальная регрессия является частным случаем линейной регрессии. Я прыгал, что, возможно, одна из обобщенных линейных моделей Scikit может быть параметризована для соответствия полиномам более высокого...

29
Как выполнить ортогональную регрессию (наименьших квадратов) с помощью PCA?

Я всегда использую lm()в R для выполнения линейной регрессии yyy на xxx . Эта функция возвращает коэффициент ββ\beta такой, что y=βx.y=βx.y = \beta x. Сегодня я узнал об общих наименьших квадратах, и эту princomp()функцию (анализ основных компонентов, PCA) можно использовать для ее выполнения. Это...

29
Псевдо-R2 Макфаддена Интерпретация

У меня есть бинарная модель логистической регрессии с псевдо R-квадратом Макфаддена 0,192 с зависимой переменной, называемой платежом (1 = оплата и 0 = нет оплаты). Какова интерпретация этого псевдо R-квадрата? Является ли это относительным сравнением для вложенных моделей (например, модель с 6...

28
Почему RSS распространяется через квадраты времени np?

Я хотел бы понять, почему в рамках модели OLS RSS (остаточная сумма квадратов) распределяется ( - это число параметров в модели, - количество наблюдений).χ2⋅(n−p)χ2⋅(n−p)\chi^2\cdot (n-p)pppnnn Я прошу прощения за то, что задал такой простой вопрос, но мне кажется, что я не могу найти ответ онлайн...

28
Почему мой вывод лассо-решения замкнутой формы неверен?

Проблема лассо имеет решение в закрытой форме: \ beta_j ^ {\ text {lasso}} = \ mathrm {sgn} (\ beta ^ {\ text {LS}} _ j) (| \ beta_j ^ {\ text {LS }} | - \ alpha) ^ + если X имеет ортонормированные столбцы. Это было показано в этой теме: Вывод лассо раствора в закрытой форме...

28
Зачем нам нужна многомерная регрессия (в отличие от группы одномерных регрессий)?

Я только что просмотрел эту замечательную книгу: « Прикладной многомерный статистический анализ» Джонсона и Вихерна . Ирония в том, что я до сих пор не могу понять мотивацию использования многомерных (регрессионных) моделей вместо отдельных одномерных (регрессионных) моделей. Я просмотрел статьи 1...

28
Почему центрирование независимых переменных может изменить основные эффекты с помощью модерации?

У меня есть вопрос, связанный с множественной регрессией и взаимодействием, навеянный этой веткой резюме: термин взаимодействия, использующий центрированные переменные иерархический регрессионный анализ? Какие переменные мы должны центрировать? При проверке эффекта модерации я центрирую свои...

28
Как бороться с мультиколлинеарностью при выборе переменных?

У меня есть набор данных с 9 непрерывными независимыми переменными. Я пытаюсь выбрать среди этих переменных, чтобы подогнать модель к одной процентной (зависимой) переменной Score. К сожалению, я знаю, что между несколькими переменными будет серьезная коллинеарность. Я пытался использовать...

28
Почему регрессия glmnet ridge дает мне другой ответ, чем ручной расчет?

Я использую glmnet для расчета оценок регрессии гребня. Я получил некоторые результаты, которые сделали меня подозрительным в том, что glmnet действительно делает то, что я думаю, что делает. Чтобы проверить это, я написал простой R-скрипт, в котором я сравниваю результат регрессии гребня,...

28
Почему p-значения вводят в заблуждение после пошагового выбора?

Давайте рассмотрим, например, модель линейной регрессии. Я слышал, что в процессе интеллектуального анализа данных после выполнения пошагового выбора на основе критерия AIC вводить в заблуждение взгляды на p-значения для проверки нулевой гипотезы о том, что каждый истинный коэффициент регрессии...

28
Каковы опасности нарушения предположения о гомоскедастичности для линейной регрессии?

В качестве примера рассмотрим ChickWeightнабор данных в R. Разница, очевидно, со временем увеличивается, поэтому, если я использую простую линейную регрессию, например: m <- lm(weight ~ Time*Diet, data=ChickWeight) Мои вопросы: Какие аспекты модели будут сомнительными? Проблемы ограничены...

28
Насколько некорректна модель регрессии, когда предположения не выполняются?

При подборе регрессионной модели, что произойдет, если предположения о выходных данных не будут выполнены, а именно Что произойдет, если остатки не будут гомоскедастичными? Если остатки показывают растущий или убывающий паттерн на графике Остатки против Приспособленного. Что произойдет, если...

28
Вычисление повторяемости эффектов по модели Лмера

Я только что наткнулся на эту статью , в которой описывается, как вычислить повторяемость (или надежность, или внутриклассовую корреляцию) измерения с помощью моделирования смешанных эффектов. Код R будет: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc =...