Вопросы с тегом «regression»

25
Интерпретация графика невязок и подгоночных значений из регрессии Пуассона

Я пытаюсь согласовать данные с GLM (регрессия Пуассона) в R. Когда я построил графики остатков и подгоночных значений, график создал несколько (почти линейных с небольшой вогнутой кривой) «линий». Что это значит? library(faraway) modl <- glm(doctorco ~ sex + age + agesq + income + levyplus +...

25
Интерпретация регуляризации гребня в регрессии

У меня есть несколько вопросов, касающихся штрафа за ребро в контексте наименьших квадратов: βR i Dге= ( λ ID+ X'Икс)- 1Икс'Yβряdгезнак равно(λяD+Икс'Икс)-1Икс'Y\beta_{ridge} = (\lambda I_D + X'X)^{-1}X'y 1) Выражение предполагает, что ковариационная матрица X сжимается в сторону диагональной...

25
Какие диагностические графики существуют для квантильной регрессии?

Следуя моему вопросу об OLS , я задаюсь вопросом: какие диагностические графики существуют для квантильной регрессии? (и есть ли у R их реализация?) Быстрый поиск в гугле уже привел к появлению червя (о котором я никогда раньше не слышал), и я был бы рад узнать о других методах, о которых вы могли...

25
Для чего нужны переменные рейтинги важности?

Я стал чем-то вроде нигилистов, когда дело доходит до переменных уровней ранжирования (в контексте многомерных моделей всех видов). Часто в ходе моей работы меня просят либо помочь другой команде составить рейтинг с переменной степенью важности, либо создать рейтинг с переменной степенью важности...

25
Как смоделировать это распределение нечетной формы (почти наоборот-J)

Моя зависимая переменная, показанная ниже, не подходит ни под какой дистрибутив, который я знаю. Линейная регрессия приводит к несколько ненормальным отклонениям в правильном направлении, которые странным образом относятся к предсказанному Y (2-й график). Какие-либо предложения для преобразований...

25
Сравнение сглаживающих сплайнов и лессов для сглаживания?

Я хочу лучше понять плюсы / минусы использования лёсса или сглаживающих сплайнов для сглаживания некоторой кривой. Другой вариант моего вопроса - есть ли способ построить сглаживающий сплайн так, чтобы он давал те же результаты, что и при использовании лёсса. Любая ссылка или понимание...

24
Алгоритмы обнаружения аномалий временных рядов

В настоящее время я использую AnomalyDetection от Twitter в R: https://github.com/twitter/AnomalyDetection . Этот алгоритм обеспечивает обнаружение аномалий временных рядов для данных с сезонностью. Вопрос: есть ли другие алгоритмы, подобные этому (контроль сезонности не имеет значения)? Я пытаюсь...

24
Регрессия L1 оценивает медиану, тогда как регрессия L2 означает?

Поэтому мне был задан вопрос, по каким оценкам центральные меры L1 (т.е. лассо) и L2 (т.е. регрессия гребня). Ответ L1 = медиана и L2 = среднее. Есть ли интуитивные рассуждения об этом? Или это должно быть определено алгебраически? Если да, то как мне это...

24
Что такое «псевдонимы»?

При построении регрессионной модели в R ( lm) я часто получаю это сообщение "there are aliased coefficients in the model" Что именно это значит? Кроме того, из-за этого predict()также дает предупреждение. Хотя это всего лишь предупреждение, я хочу знать, как мы можем обнаружить / удалить псевдонимы...

24
Какова связь между регрессией и линейным дискриминантным анализом (LDA)?

Существует ли связь между регрессией и линейным дискриминантным анализом (LDA)? Каковы их сходства и различия? Имеет ли какое-то значение, если есть два класса или более двух...

24
Почему логистическая регрессия является линейной моделью?

Я хочу знать, почему логистическая регрессия называется линейной моделью. Он использует сигмовидную функцию, которая не является линейной. Так почему же логистическая регрессия является линейной...

24
ANOVA против множественной линейной регрессии? Почему ANOVA так часто используется в экспериментальных исследованиях?

ANOVA против множественной линейной регрессии? Я понимаю, что оба эти метода, похоже, используют одну и ту же статистическую модель. Однако при каких обстоятельствах я должен использовать какой метод? Каковы преимущества и недостатки этих методов при сравнении? Почему ANOVA так часто используется в...

24
Уравнения в новостях: перевод многоуровневой модели для широкой аудитории

В «Нью-Йорк Таймс» содержится длинный комментарий о «добавленной стоимости» системы оценки учителей, используемой для обратной связи с педагогами Нью-Йорка. Леде - это уравнение, используемое для расчета баллов - представленное без контекста. Риторическая стратегия выглядит запугиванием с помощью...

24
Интервал прогнозирования линейной регрессии

Если наилучшим линейным приближением (с использованием наименьших квадратов) моих точек данных является линия y=mx+by=mx+by=mx+b , как я могу рассчитать ошибку аппроксимации? Если я вычислю стандартное отклонение различий между наблюдениями и предсказаниями , могу ли я потом сказать, что...

24
Как спроектировать и реализовать асимметричную функцию потерь для регрессии?

проблема В регрессии обычно вычисляют среднеквадратическую ошибку (MSE) для выборки: MSE=1n∑i=1n(g(xi)−gˆ(xi))2MSE=1n∑i=1n(g(xi)−g^(xi))2 \text{MSE} = \frac{1}{n} \sum_{i=1}^n\left(g(x_i) - \widehat{g}(x_i)\right)^2 для измерения качества предсказателя. Сейчас я работаю над проблемой регрессии,...

24
Почему силовые или логарифмические преобразования не преподаются в машинном обучении?

Машинное обучение (ML) активно использует методы линейной и логистической регрессии. Он также опирается на особенность инженерных методов ( feature transform, kernel, и т.д.). Почему нет ничего о variable transformation(например power transformation) , упомянутые в ML? (Например, я никогда не...

24
В каком порядке следует проводить линейную регрессионную диагностику?

В линейном регрессионном анализе мы анализируем выбросы, исследуем мультиколлинеарность, тестируем гетероскедастичность. Вопрос в том, есть ли порядок их применения? Я имею в виду, нужно ли сначала анализировать выбросы, а затем изучать мультиколлинеарность? Или поменять? Есть ли эмпирическое...

24
Почему лямбда «в пределах одной стандартной ошибки от минимума» является рекомендованным значением для лямбда в упругой чистой регрессии?

Я понимаю, какую роль играет лямбда в регрессии эластичной сети. И я могу понять, почему можно выбрать lambda.min, значение лямбды, которое минимизирует перекрестную проверку. Мой вопрос: где в статистической литературе рекомендуется использовать lambda.1se, то есть значение lambda, которое...