Вопросы с тегом «regression»

11
Как интерпретировать результаты, когда гребень и лассо по отдельности работают хорошо, но дают разные коэффициенты

Я использую регрессионную модель с Лассо и Риджем (для прогнозирования дискретной переменной результата в диапазоне от 0 до 5). Перед запуском модели я использую SelectKBestметод, scikit-learnчтобы уменьшить набор функций с 250 до 25 . Без первоначального выбора признаков и Лассо, и Ридж уступают...

11
В чем разница между детерминированной и стохастической моделью?

Простая линейная модель: х = α т + ϵTИксзнак равноαT+εTx=\alpha t + \epsilon_t где ~ iid N ( 0 , сг 2 )εTεT\epsilon_tN( 0 , σ2)N(0,σ2)N(0,\sigma^2) с иV a r ( x ) = σ 2Е( х ) = α тЕ(Икс)знак равноαTE(x) = \alpha tВa r ( x ) = σ2Вaр(Икс)знак равноσ2Var(x)=\sigma^2 АР (1): ИксT= α Xт - 1+ ϵTИксTзнак...

11
Когда использовать модель со смешанным эффектом?

Модели линейных смешанных эффектов - это расширения моделей линейной регрессии для данных, которые собираются и обобщаются в группы. Ключевым преимуществом является то, что коэффициенты могут варьироваться по отношению к одной или нескольким групповым переменным. Тем не менее, я борюсь с тем, когда...

11
Является ли разделение данных на тестовые и обучающие наборы чисто статистическими данными?

Я студент-физик, изучающий машинное обучение / науку о данных, поэтому я не хочу, чтобы этот вопрос вызвал какие-либо конфликты :) Однако большая часть любой программы по физике для студентов-физиков - это проведение лабораторных работ / экспериментов, что означает много данных. обработка и...

11
Проблемы с горячим кодированием и фиктивным кодированием

Мне известен тот факт, что категориальные переменные с k уровнями должны кодироваться с помощью k-1 переменных в фиктивном кодировании (аналогично для многозначных категориальных переменных). Мне было интересно, сколько проблем делает одноразовое кодирование (то есть использование вместо этого k...

11
Почему LKJcorr является хорошим приоритетом для корреляционной матрицы?

Я читаю главу 13 «Приключения в ковариации» в ( превосходной ) книге Ричарда Мак-Элирея « Статистическое переосмысление », где он представляет следующую иерархическую модель: ( Rэто корреляционная матрица) Автор объясняет, что LKJcorrэто слабоинформативный априор, который работает как...

11
Искусственные нейронные сети, эквивалентные линейной регрессии с полиномиальными признаками?

Я хочу улучшить свое понимание нейронных сетей и их преимуществ по сравнению с другими алгоритмами машинного обучения. Мое понимание, как показано ниже, и мой вопрос: Можете ли вы исправить и дополнить мое понимание, пожалуйста? :) Мое понимание: (1) Искусственные нейронные сети = функция, которая...

11
Почему эти таблицы регрессионных анова идентичны?

У меня есть две регрессии одного и того же Y и трехуровневого X. В целом n = 15, с n = 5 в каждой группе или уровне X. Первая регрессия рассматривает X как категоричный, присваивая переменные индикатора уровням 2 и 3 с уровнем один из которых является ссылкой. Индикаторы / манекены выглядят так: X1...

11
Почему методы регрессии методом наименьших квадратов и максимального правдоподобия не эквивалентны, когда ошибки обычно не распределяются?

Название говорит обо всем. Я понимаю, что наименьшие квадраты и максимальное правдоподобие дадут одинаковый результат для коэффициентов регрессии, если ошибки модели будут нормально распределены. Но что произойдет, если ошибки не распределяются нормально? Почему два метода больше не...

11
Многомерная линейная регрессия против нескольких одномерных моделей регрессии

В настройках одномерной регрессии мы пытаемся моделировать Y= Хβ+ П о я с йYзнак равноИксβ+Nояsеy = X\beta +noise где вектор из наблюдений, а матрица проектирования с предикторами. Решение: . n X ∈ R n × m m β 0 = ( X T X ) - 1 X yY∈RNY∈рNy \in \mathbb{R}^nNNnИкс∈Rн × мИкс∈рN×мX \in \mathbb{R}^{n...

11
Как рассчитать доверительные оценки в регрессии (со случайными лесами / XGBoost) для каждого прогноза в R?

Есть ли способ получить показатель достоверности (мы можем также назвать его значением достоверности или вероятности) для каждого прогнозируемого значения при использовании таких алгоритмов, как Random Forests или Extreme Gradient Boosting (XGBoost)? Допустим, этот показатель доверия будет...

11
Следует ли использовать поправки степеней свободы для определения параметров GLM?

Этот вопрос вдохновлен ответом Мартина здесь . Предположим, что мы подходим к GLM для однопараметрического семейства, такого как биномиальная модель или модель Пуассона, и что это процедура полного правдоподобия (в отличие от квазипуассона). Тогда дисперсия является функцией среднего значения. С...

11
Скрытие регрессионной модели от профессора (линкор регрессии) [закрыто]

Закрыто . Этот вопрос нуждается в деталях или ясности . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Добавьте детали и проясните проблему, отредактировав этот пост . Закрыто 2 года назад . Я работаю над домашним заданием, где мой профессор хотел бы, чтобы мы создали...

11
Понимание формы доверительного интервала для полиномиальной регрессии (MLR)

Мне трудно понять форму доверительного интервала полиномиальной регрессии. Ниже приведен пример Y^= a + b ⋅ X+ c ⋅ X2Y^знак равноa+б⋅Икс+с⋅Икс2\hat{Y}=a+b\cdot X+c\cdot X^2 . На левом рисунке показана UPV (немасштабированная дисперсия прогноза), а на правом графике показан доверительный интервал и...

11
Может ли линейная регрессия быть значимой, если данные не являются линейными?

Я выполнил линейную регрессию, которая дала значительный результат, однако, когда я проверил диаграмму рассеяния на линейность, я не был уверен, что данные были линейными. Существуют ли другие способы проверки линейности без проверки диаграммы рассеяния? Может ли линейная регрессия быть значимой,...

11
Что означает термин «редкий априорный» (FBProphet Paper)?

Читая статью «Прогнозирование в масштабе» (инструмент прогнозирования FBProphet, см. Https://peerj.com/preprints/3190.pdf ), я натолкнулся на термин «разреженный априор». Авторы объясняют, что они использовали такой «разреженный априор» при моделировании вектора отклонений скорости...

11
Показана эквивалентность между

По ссылкам Книга 1 , Книга 2 и бумага . Было упомянуто, что существует эквивалентность между регуляризованной регрессией (Ridge, LASSO и Elastic Net) и их формулами ограничения. Я также посмотрел на Cross Validated 1 и Cross Validated 2 , но я не вижу четкого ответа, демонстрирующего эту...

11
Насколько различны ограниченные кубические сплайны и штрафные сплайны?

Я много читаю об использовании сплайнов в различных регрессионных задачах. В некоторых книгах (например, в линейных моделях Парриметриза Ходжеса ) рекомендуются штрафные сплайны. Другие (например, стратегии регрессионного моделирования Харрелла ) выбирают ограниченные кубические сплайны. Насколько...

11
Почему модели «ошибка в X» не используются более широко?

При расчете стандартной ошибки коэффициента регрессии, мы не учитываем хаотичности в конструкции матрице . Например, в OLS мы вычисляем какИксИксXвар ( β^)вар(β^)\text{var}(\hat{\beta})вар ( ( XTИкс)- 1ИксTY) = σ2( ХTИкс)- 1вар((ИксTИкс)-1ИксTY)знак равноσ2(ИксTИкс)-1\text{var}((X^TX)^{-1}X^TY) =...

11
Пророк из Facebook отличается от линейной регрессии?

Итак, что я прочитал о пророке Facebook, так это то, что он в основном разбивает временные ряды на тренды и сезонность. Например, аддитивная модель будет записана как: Y( т ) = г( t ) + s ( t ) + h ( t ) + eTY(T)знак равног(T)+s(T)+час(T)+еT y(t) = g(t) + s(t) + h(t) + e_t с TTt время г( т...