Вопросы с тегом «regression»

25

Интерпретация графика невязок и подгоночных значений из регрессии Пуассона

Я пытаюсь согласовать данные с GLM (регрессия Пуассона) в R. Когда я построил графики остатков и подгоночных значений, график создал несколько (почти линейных с небольшой вогнутой кривой) «линий». Что это значит? library(faraway) modl <- glm(doctorco ~ sex + age + agesq + income + levyplus +...

r self-study generalized-linear-model poisson-regression

25

Интерпретация регуляризации гребня в регрессии

У меня есть несколько вопросов, касающихся штрафа за ребро в контексте наименьших квадратов: βR i Dге= ( λ ID+ X'Икс)- 1Икс'Yβряdгезнак равно(λяD+Икс'Икс)-1Икс'Y\beta_{ridge} = (\lambda I_D + X'X)^{-1}X'y 1) Выражение предполагает, что ковариационная матрица X сжимается в сторону диагональной...

regression pca regularization ridge-regression

25

Какие диагностические графики существуют для квантильной регрессии?

Следуя моему вопросу об OLS , я задаюсь вопросом: какие диагностические графики существуют для квантильной регрессии? (и есть ли у R их реализация?) Быстрый поиск в гугле уже привел к появлению червя (о котором я никогда раньше не слышал), и я был бы рад узнать о других методах, о которых вы могли...

r regression diagnostic quantile-regression gamlss

25

Для чего нужны переменные рейтинги важности?

Я стал чем-то вроде нигилистов, когда дело доходит до переменных уровней ранжирования (в контексте многомерных моделей всех видов). Часто в ходе моей работы меня просят либо помочь другой команде составить рейтинг с переменной степенью важности, либо создать рейтинг с переменной степенью важности...

multiple-regression multivariate-analysis importance

25

Как смоделировать это распределение нечетной формы (почти наоборот-J)

Моя зависимая переменная, показанная ниже, не подходит ни под какой дистрибутив, который я знаю. Линейная регрессия приводит к несколько ненормальным отклонениям в правильном направлении, которые странным образом относятся к предсказанному Y (2-й график). Какие-либо предложения для преобразований...

regression multiple-regression data-transformation censoring

25

Сравнение сглаживающих сплайнов и лессов для сглаживания?

Я хочу лучше понять плюсы / минусы использования лёсса или сглаживающих сплайнов для сглаживания некоторой кривой. Другой вариант моего вопроса - есть ли способ построить сглаживающий сплайн так, чтобы он давал те же результаты, что и при использовании лёсса. Любая ссылка или понимание...

regression splines loess

24

Алгоритмы обнаружения аномалий временных рядов

В настоящее время я использую AnomalyDetection от Twitter в R: https://github.com/twitter/AnomalyDetection . Этот алгоритм обеспечивает обнаружение аномалий временных рядов для данных с сезонностью. Вопрос: есть ли другие алгоритмы, подобные этому (контроль сезонности не имеет значения)? Я пытаюсь...

r regression time-series anomaly-detection

24

Регрессия L1 оценивает медиану, тогда как регрессия L2 означает?

Поэтому мне был задан вопрос, по каким оценкам центральные меры L1 (т.е. лассо) и L2 (т.е. регрессия гребня). Ответ L1 = медиана и L2 = среднее. Есть ли интуитивные рассуждения об этом? Или это должно быть определено алгебраически? Если да, то как мне это...

lasso regularization loss-functions ridge-regression

24

Что такое «псевдонимы»?

При построении регрессионной модели в R ( lm) я часто получаю это сообщение "there are aliased coefficients in the model" Что именно это значит? Кроме того, из-за этого predict()также дает предупреждение. Хотя это всего лишь предупреждение, я хочу знать, как мы можем обнаружить / удалить псевдонимы...

r regression

24

Регрессия только с категориальными переменными

Можно ли провести регрессию, если все зависимые и независимые переменные являются категориальными

regression logistic categorical-data

24

Какова связь между регрессией и линейным дискриминантным анализом (LDA)?

Существует ли связь между регрессией и линейным дискриминантным анализом (LDA)? Каковы их сходства и различия? Имеет ли какое-то значение, если есть два класса или более двух...

regression logistic discriminant-analysis canonical-correlation reduced-rank-regression

24

Почему логистическая регрессия является линейной моделью?

Я хочу знать, почему логистическая регрессия называется линейной моделью. Он использует сигмовидную функцию, которая не является линейной. Так почему же логистическая регрессия является линейной...

regression logistic terminology

24

ANOVA против множественной линейной регрессии? Почему ANOVA так часто используется в экспериментальных исследованиях?

ANOVA против множественной линейной регрессии? Я понимаю, что оба эти метода, похоже, используют одну и ту же статистическую модель. Однако при каких обстоятельствах я должен использовать какой метод? Каковы преимущества и недостатки этих методов при сравнении? Почему ANOVA так часто используется в...

anova multiple-regression least-squares

24

Уравнения в новостях: перевод многоуровневой модели для широкой аудитории

В «Нью-Йорк Таймс» содержится длинный комментарий о «добавленной стоимости» системы оценки учителей, используемой для обратной связи с педагогами Нью-Йорка. Леде - это уравнение, используемое для расчета баллов - представленное без контекста. Риторическая стратегия выглядит запугиванием с помощью...

regression multilevel-analysis statistics-in-media

24

Интервал прогнозирования линейной регрессии

Если наилучшим линейным приближением (с использованием наименьших квадратов) моих точек данных является линия y=mx+by=mx+by=mx+b , как я могу рассчитать ошибку аппроксимации? Если я вычислю стандартное отклонение различий между наблюдениями и предсказаниями , могу ли я потом сказать, что...

regression normal-distribution least-squares prediction-interval

24

Квантильная регрессия: функция потери

Я пытаюсь понять квантильную регрессию, но одна вещь, которая заставляет меня страдать, это выбор функции потерь. ρτ(u)=u(τ−1{u<0})ρτ(u)=u(τ−1{u<0})\rho_\tau(u) =

quantiles loss-functions quantile-regression

24

Как спроектировать и реализовать асимметричную функцию потерь для регрессии?

проблема В регрессии обычно вычисляют среднеквадратическую ошибку (MSE) для выборки: MSE=1n∑i=1n(g(xi)−gˆ(xi))2MSE=1n∑i=1n(g(xi)−g^(xi))2 \text{MSE} = \frac{1}{n} \sum_{i=1}^n\left(g(x_i) - \widehat{g}(x_i)\right)^2 для измерения качества предсказателя. Сейчас я работаю над проблемой регрессии,...

regression error loss-functions

24

Почему силовые или логарифмические преобразования не преподаются в машинном обучении?

Машинное обучение (ML) активно использует методы линейной и логистической регрессии. Он также опирается на особенность инженерных методов ( feature transform, kernel, и т.д.). Почему нет ничего о variable transformation(например power transformation) , упомянутые в ML? (Например, я никогда не...

regression machine-learning data-transformation

24

В каком порядке следует проводить линейную регрессионную диагностику?

В линейном регрессионном анализе мы анализируем выбросы, исследуем мультиколлинеарность, тестируем гетероскедастичность. Вопрос в том, есть ли порядок их применения? Я имею в виду, нужно ли сначала анализировать выбросы, а затем изучать мультиколлинеарность? Или поменять? Есть ли эмпирическое...

regression multiple-regression outliers

24

Почему лямбда «в пределах одной стандартной ошибки от минимума» является рекомендованным значением для лямбда в упругой чистой регрессии?

Я понимаю, какую роль играет лямбда в регрессии эластичной сети. И я могу понять, почему можно выбрать lambda.min, значение лямбды, которое минимизирует перекрестную проверку. Мой вопрос: где в статистической литературе рекомендуется использовать lambda.1se, то есть значение lambda, которое...

regression cross-validation regularization glmnet elastic-net