Вопросы с тегом «regression»

11
R - Лассо регрессия - разные лямбда на регрессор

Я хочу сделать следующее: 1) регрессия OLS (без штрафных санкций) для получения бета-коэффициентов ; обозначает переменные, используемые для регрессии. Я делаю этоb∗jbj∗b_{j}^{*}jjj lm.model = lm(y~ 0 + x) betas = coefficients(lm.model) 2) регрессия Лассо с условием штрафования, критериями выбора...

11
Когда коэффициенты, оцениваемые логистической и логит-линейной регрессией, отличаются?

При моделировании непрерывных пропорций (например, пропорционального растительного покрова на съемочных квадратах или доли времени, вовлеченного в деятельность), логистическая регрессия считается неуместной (например, Warton & Hui (2011). Арксинус асинин: анализ пропорций в экологии ). Скорее,...

11
Инкрементная Гауссова регрессия процесса

Я хочу реализовать постепенную гауссовскую регрессию процесса, используя скользящее окно над точками данных, которое приходит один за другим через поток. Пусть обозначает размерность входного пространства. Итак, каждая точка данных имеет количество элементов.dddxixix_iddd Пусть будет размером...

11
Каковы различия между регрессией Риджа с использованием R glmnet и Python scikit-learn?

Я изучаю раздел LAB §6.6, посвященный регрессии Риджа / Лассо, в книге Джеймса Виттена «Hastie», Tibshirani (2013) «Введение в статистическое обучение с приложениями в R» . Более конкретно, я пытаюсь применить модель scikit-learn Ridgeк набору данных 'Hitters' из пакета R 'ISLR'. Я создал такой же...

11
Байесовская модель логита - интуитивное объяснение?

Я должен признаться, что раньше я не слышал об этом термине ни в одном из моих классов, старшекурсников или выпускников. Что значит для логистической регрессии быть байесовским? Я ищу объяснение с переходом от обычной логистики к байесовской логистике, подобное следующему: Это уравнение в модели...

11
Слияние наблюдений в гауссовском процессе

Я использую гауссовский процесс (ГП) для регрессии. В моей задаче довольно часто две или более точек данных находятся близко друг к другу относительно длины масштабы проблемы. Также наблюдения могут быть очень шумными. Чтобы ускорить вычисления и повысить точность измерений , кажется естественным...

11
Каковы преимущества различных подходов к обнаружению коллинеарности?

Я хочу определить, является ли коллинеарность проблемой в моей регрессии МНК. Я понимаю, что факторы инфляции дисперсии и индекс состояния являются двумя часто используемыми показателями, но мне трудно найти что-то определенное с точки зрения достоинств каждого подхода или какими должны быть...

11
Ресурсы для изучения многоцелевых методов?

Я ищу ресурсы (книги, конспекты лекций и т. Д.) О методах обработки данных с несколькими целями (например, три зависимые переменные: 2 дискретные и 1 непрерывная). У кого-нибудь есть ресурсы / знания по этому вопросу? Я знаю, что для этого можно использовать нейронные сети....

11
Деревья решений и регрессия - Могут ли прогнозируемые значения выходить за пределы диапазона данных обучения?

Когда речь идет о деревьях решений, может ли прогнозируемое значение лежать вне диапазона обучающих данных? Например, если диапазон набора обучающих данных целевой переменной составляет 0-100, когда я генерирую свою модель и применяю ее к чему-то другому, могут ли мои значения быть -5? или 150?...

11
Корректировки прогноза (линейная регрессия)

Полное раскрытие: я не статистик и не претендую на это. Я скромный ИТ-администратор. Пожалуйста, играйте осторожно со мной. :) Я отвечаю за сбор и прогнозирование использования дискового пространства для нашего предприятия. Мы собираем данные об использовании хранилища ежемесячно и используем...

11
Насколько отличается регрессия вектора поддержки по сравнению с SVM?

Я знаю основы SVM и SVR, но до сих пор не понимаю, как проблема нахождения гиперплоскости, которая максимизирует запас, вписывается в SVR. Во-вторых, я прочитал кое-что о используемом в качестве предела терпимости в SVR. Что это означает?εϵ\epsilon В-третьих, есть ли разница между параметрами...

11
Регрессия с искаженными данными

Попытка рассчитать количество посещений из демографии и обслуживания. Данные очень искажены. Гистограммы: qq графики (слева - лог): m <- lm(d$Visits~d$Age+d$Gender+city+service) m <- lm(log(d$Visits)~d$Age+d$Gender+city+service) cityи serviceявляются факторными переменными. Я получаю низкое...

11
Каковы преимущества ступенчатой ​​регрессии?

Я экспериментирую со ступенчатой ​​регрессией ради разнообразия в моем подходе к проблеме. Итак, у меня есть 2 вопроса: Каковы преимущества ступенчатой ​​регрессии? Каковы его конкретные сильные стороны? Что вы думаете о гибридном подходе, где вы используете ступенчатую регрессию для выбора...

11
Линейная регрессия, условные ожидания и ожидаемые значения

Хорошо, так что немного помутнение некоторых вещей, любая помощь будет высоко ценится. Насколько я понимаю, модель линейной регрессии прогнозируется через условное ожидание E(Y|X)=b+Xb+eЕ(Y|Икс)знак равноб+Иксб+еE(Y|X)=b+Xb+e Предполагаем ли мы, что и являются случайными переменными с некоторым...

11
Является ли множественная линейная регрессия в 3 измерениях плоскостью наилучшего соответствия или линией наилучшего соответствия?

Наш проф не входит в математику или даже геометрическое представление множественной линейной регрессии, и это меня немного смущает. С одной стороны, это все еще называется множественной линейной регрессией, даже в более высоких измерениях. С другой стороны, если мы, например , Y = B 0 + B 1 X 1 + Ь...

11
R / mgcv: Почему тензорные продукты te () и ti () производят разные поверхности?

mgcvПакет Rимеет две функции для установки взаимодействия Тензор продукта: te()и ti(). Я понимаю основное разделение труда между ними (подгонка нелинейного взаимодействия против разложения этого взаимодействия на основные эффекты и взаимодействие). Чего я не понимаю, так это почему te(x1, x2)и...

11
Как начать строить регрессионную модель, когда наиболее сильно ассоциированный предиктор является двоичным

У меня есть набор данных, содержащий 365 наблюдений трех переменных, а именно pm, tempи rain. Теперь я хочу проверить поведение pmв ответ на изменения в двух других переменных. Мои переменные: pm10 = Ответ (зависимый) temp = предиктор (независимый) rain = предиктор (независимый) Ниже приведена...

11
Если усадка применяется умным способом, всегда ли она работает лучше для более эффективных оценщиков?

Предположим, у меня есть два оценщика и которые являются согласованными оценками одного и того же параметра и такого, что с в смысле psd. Таким образом, асимптотически более эффективен, чем . Эти две оценки основаны на различных функциях потерь. β...

11
Если вы не можете сделать это ортогонально, сделайте это необработанно (полиномиальная регрессия)

При выполнении полиномиальной регрессии для на люди иногда используют необработанные полиномы, иногда ортогональные полиномы. Но когда они используют то, что кажется совершенно произвольным.YYYИксИксX Здесь и здесь используются сырые полиномы. Но здесь и здесь ортогональные полиномы, кажется, дают...