Вопросы с тегом «regression»

18
Разница между Первичной, Двойственной и Ядровой Регрессией

В чем разница между Первичной , Двойственной и Ядровой Регрессией? Люди используют все три, и из-за разных обозначений, которые все используют в разных источниках, мне трудно следовать. Так может кто-нибудь сказать мне простыми словами, в чем разница между этими тремя? Кроме того, в чем могут быть...

18
По какой причине преобразование журналов используется с искаженными дистрибутивами?

Я однажды слышал, что логарифмическое преобразование является наиболее популярным для правосторонних распределений в линейной регрессии или квантильной регрессии Я хотел бы знать, есть ли причина, лежащая в основе этого утверждения? Почему преобразование журналов подходит для правильного...

18
Интерпретация бета при наличии нескольких категориальных переменных

Я понимаю концепцию, что является средним значением, когда категориальная переменная равна 0 (или является контрольной группой), давая конечную интерпретацию того, что коэффициент регрессии - это разница в среднем двух категорий. Даже при> 2 категориях я бы предположил, что каждая объясняет...

18
Что объясняет добавленный график переменных (график частичной регрессии) в множественной регрессии?

У меня есть модель набора данных Movies, и я использовал регрессию: model <- lm(imdbVotes ~ imdbRating + tomatoRating + tomatoUserReviews+ I(genre1 ** 3.0) +I(genre2 ** 2.0)+I(genre3 ** 1.0), data = movies) library(ggplot2) res <- qplot(fitted(model), resid(model))...

18
Существует ли четкий набор условий, при которых пути лассо, гребня или эластичной сетки монотонны?

Вопрос « Что делать из этого лассо-графика (glmnet)» демонстрирует пути решения для оценки лассо, которые не являются монотонными. То есть некоторые коэффициенты растут по абсолютной величине, а затем сокращаются. Я применил эти модели к нескольким видам наборов данных и никогда не видел такого...

18
Доказательство формулы LOOCV

Из «Введения в статистическое обучение » Джеймса и др., Оценка перекрестной проверки (LOOCV) определяется как где .резюме( н )= 1NΣя = 1NMSEярезюме(N)знак равно1NΣязнак равно1NMSEя\text{CV}_{(n)} = \dfrac{1}{n}\sum\limits_{i=1}^{n}\text{MSE}_iMSEя= ( уя- у^я)2MSEязнак равно(Yя-Y^я)2\text{MSE}_i =...

18
Шпаргалка ANOVA Алфавитный суп и регрессивные эквиваленты

Могу ли я получить помощь в завершении этой пробной (находящейся в процессе) попытки получить ориентиры по эквивалентам ANOVA и REGRESSION? Я пытался согласовать понятия, номенклатуру и синтаксис этих двух методологий. На этом сайте есть много сообщений об их общности, например, об этом или об этом...

18
В модели Пуассона, в чем разница между использованием времени как ковариаты или смещения?

Недавно я обнаружил, как моделировать экспозиции во времени, используя журнал (например) времени как смещение в регрессии Пуассона. Я понял, что смещение соответствует времени как ковариации с коэффициентом 1. Я хотел бы лучше понять разницу между использованием времени в качестве смещения или в...

18
Действительно ли мы проводим многомерный регрессионный анализ с * миллионами * коэффициентов / независимых переменных?

Я провожу некоторое время, изучая машинное обучение (извините за рекурсию :), и я не мог не заинтриговать эмпирическое правило выбора градиентного спуска вместо прямого решения уравнений для вычисления коэффициентов регрессии, в случае многомерной линейной регрессии. 10 , 000 - 1 , 000 ,...

18
Как обрабатывать порядковую категориальную переменную как независимую переменную

Я использую модель Logit. Моя зависимая переменная является двоичной. Однако у меня есть независимая переменная , которая является категоричным и содержит ответы: 1.very good, 2.good, 3.average, 4.poor and 5.very poor. Итак, это порядковый номер («количественный категориальный»). Я не уверен, как...

18
Почему обычные наименьшие квадраты работают лучше, чем регрессия Пуассона?

Я пытаюсь подогнать регрессию, чтобы объяснить количество убийств в каждом районе города. Хотя я знаю, что мои данные соответствуют распределению Пуассона, я попытался подобрать OLS следующим образом: л о г( у+ 1 ) = α + βИкс+ ϵlog(y+1)=α+βX+ϵlog(y+1) = \alpha + \beta X + \epsilon Затем я также...

18
что делает нейронные сети нелинейной классификационной моделью?

Я пытаюсь понять математический смысл нелинейных классификационных моделей: Я только что прочитал статью о том, что нейронные сети являются нелинейной классификационной моделью. Но я просто понимаю, что: Первый слой: h1=x1∗wx1h1+x2∗wx1h2h1=x1∗wx1h1+x2∗wx1h2h_1=x_1∗w_{x1h1}+x_2∗w_{x1h2}...

18
Есть ли предположение о логистической регрессии?

Есть ли предположение о переменной ответа логистической регрессии? Например, предположим, у нас есть точек данных. Похоже, что ответ исходит из дистрибутива Бернулли с . Следовательно, мы должны иметь распределений Бернулли с другим параметром .Y i p i = логит ( β 0 + β 1 x i ) 1000...

18
Интуитивное объяснение

Если имеет полный ранг, существует обратное к и мы получаем оценку наименьших квадратов: иХ Т Х β = ( Х Т Х ) - 1 х YXXXXTXXTXX^TXβ^=(XTX)−1XYβ^=(XTX)−1XY\hat\beta = (X^TX)^{-1}XYVar(β^)=σ2(XTX)−1Var⁡(β^)=σ2(XTX)−1\operatorname{Var}(\hat\beta) = \sigma^2(X^TX)^{-1} Как мы можем интуитивно объяснить...

18
Линейная регрессия или порядковая логистическая регрессия для прогнозирования рейтинга вина (от 0 до 10)

У меня есть данные вина из здесь , который состоит из 11 числовых независимых переменных с зависимой рейтинг , связанной с каждой записью со значениями от 0 до 10. Это делает его отличный набор данные , чтобы использовать регрессионную модель для изучения взаимосвязи между переменными и...

18
Использование регуляризации при выполнении статистического вывода

Я знаю о преимуществах регуляризации при построении прогностических моделей (смещение против дисперсии, предотвращение переоснащения). Но мне интересно, будет ли хорошей идеей также выполнять регуляризацию (лассо, гребень, упругая сеть), когда основной целью регрессионной модели является вывод на...

18
Имеет ли смысл использовать логистическую регрессию с двоичным результатом и предиктором?

У меня есть двоичная переменная результата {0,1} и переменная предиктора {0,1}. Я думаю, что не имеет смысла заниматься логистикой, если я не включу другие переменные и не вычислю соотношение шансов. С одним бинарным предиктором не будет ли вычисление вероятности достаточным в сравнении с...

18
Является ли случайный лес для регрессии «истинной» регрессией?

Случайные леса используются для регрессии. Однако, насколько я понимаю, они назначают среднее целевое значение на каждом листе. Так как в каждом дереве есть только ограниченные листья, есть только определенные значения, которые цель может получить из нашей регрессионной модели. Таким образом, разве...

18
Страдает ли LASSO от тех же проблем, что и ступенчатая регрессия?

Пошаговые алгоритмические методы выбора переменных имеют тенденцию выбирать для моделей, которые смещают более или менее каждую оценку в регрессионных моделях ( ββ\beta s и их SE, p-значения , F- статистику и т. Д.), И примерно с такой же вероятностью исключают истинные предикторы, как включают...