Вопросы с тегом «regression»

15

Сравнение Ньюи-Уэста (1987) и Хансена-Ходрика (1980)

Вопрос: Каковы основные различия и сходства между использованием стандартных ошибок Newey-West (1987) и Hansen-Hodrick (1980)? В каких ситуациях одна из них должна быть предпочтительнее другой? Примечания: Я знаю, как работает каждая из этих процедур настройки; однако я еще не нашел ни одного...

15

Является ли сумма двух деревьев решений эквивалентной одному дереву решений?

Предположим, у нас есть два дерева регрессии (дерево A и дерево B), которые отображают входные данные на выходные данные . Пусть \ hat {y} = f_A (x) для дерева A и f_B (x) для дерева B. Каждое дерево использует двоичные разбиения с гиперплоскостями в качестве разделяющих функций.x∈Rdx∈Rdx \in...

regression machine-learning cart

15

Нейронные сети против всего остального

Я не нашел удовлетворительного ответа на этот вопрос от Google . Конечно, если у меня есть данные порядка нескольких миллионов, то глубокое обучение - это путь. И я прочитал, что, когда у меня нет больших данных, тогда, возможно, лучше использовать другие методы в машинном обучении. Приведенная...

regression machine-learning classification neural-networks deep-learning

15

Доказательство эквивалентных формул гребневой регрессии

Я прочитал самые популярные книги в области статистического обучения 1- Элементы статистического обучения. 2- Введение в статистическое обучение . Оба упоминают, что у регрессии гребня есть две формулы, которые эквивалентны. Есть ли понятное математическое доказательство этого результата? Я также...

regression lasso regularization ridge-regression lagrange-multipliers

15

Расчет доверительных интервалов для логистической регрессии

Я использую биномиальную логистическую регрессию , чтобы определить , если воздействие has_xили has_yвоздействий на вероятность того , что пользователь нажмет на что - то. Моя модель следующая: fit = glm(formula = has_clicked ~ has_x + has_y, data=df, family = binomial()) Это вывод из моей модели:...

regression logistic standard-error logit

15

Зачем нужны предположения в линейной регрессии?

В линейной регрессии мы делаем следующие предположения Среднее значение ответа E(Yi)E(Yi)E(Y_i) каждого набора значений предикторов (x1i,x2i,…)(x1i,x2i,…)(x_{1i}, x_{2i},…) является линейной функцией предикторов. Ошибки являются независимыми.εiεiε_i Ошибки при каждом наборе значений предикторов (x_...

regression assumptions

15

Когда использовать GAM против GLM

Я понимаю, что это может быть потенциально широкий вопрос, но мне было интересно, существуют ли обобщенные предположения, которые указывают на использование GAM (Обобщенная аддитивная модель) над GLM (Обобщенная линейная модель)? Кто-то недавно сказал мне, что GAM следует использовать только тогда,...

regression generalized-linear-model gam

15

Являются ли тесты на избыточную дисперсию в GLM действительно * полезными *?

Феномен «чрезмерной дисперсии» в GLM возникает всякий раз, когда мы используем модель, которая ограничивает дисперсию переменной отклика, и данные демонстрируют большую дисперсию, чем позволяет ограничение модели. Это обычно происходит при моделировании данных подсчета с использованием Poisson GLM,...

generalized-linear-model poisson-regression overdispersion quasi-likelihood

15

Почему предположение о нормальности в линейной регрессии

Мой вопрос очень прост: почему мы выбираем нормальное в качестве распределения, которому следует термин ошибки в предположении о линейной регрессии? Почему мы не выбираем других, как униформу, т или...

regression mathematical-statistics normal-distribution error linear

15

Каковы преимущества линейной регрессии над квантильной регрессией?

Модель линейной регрессии делает кучу предположений, что квантильная регрессия не делает, и, если предположения о линейной регрессии соблюдаются, то моя интуиция (и некоторый очень ограниченный опыт) состоит в том, что срединная регрессия даст почти идентичные результаты как линейная регрессия....

regression multiple-regression quantile-regression

15

Почему усадка действительно работает, что такого особенного в 0?

На этом сайте уже есть пост, посвященный той же проблеме: почему работает усадка? Но, хотя ответы и популярны, я не верю, что суть вопроса действительно решена. Совершенно очевидно, что введение некоторого смещения в оценку приводит к снижению дисперсии и может улучшить качество оценки. Тем не...

regularization ridge-regression shrinkage

15

Какая кривая (или модель) должна соответствовать моим процентным данным?

Я пытаюсь создать фигуру, которая показывает связь между вирусными копиями и освещением генома (GCC). Вот как выглядят мои данные: Сначала я только построил линейную регрессию, но мои руководители сказали мне, что это неправильно, и попробовал сигмоидальную кривую. Поэтому я сделал это с помощью...

regression modeling curve-fitting percentage

14

Можно ли сделать модели CART надежными?

Коллега в моем офисе сказал мне сегодня: «Модели деревьев не хороши, потому что их ловят экстремальные наблюдения». Поиск здесь привел к этой теме, которая в основном поддерживает претензию. Что приводит меня к вопросу - в какой ситуации модель CART может быть надежной и как это...

regression classification robust cart

14

МЕНЬШЕ, что позволяет разрывы

Существует ли метод моделирования, такой как LOESS, который допускает ноль, один или несколько разрывов, где время разрывов не известно априори? Если метод существует, есть ли существующая реализация в R?...

r regression curve-fitting change-point loess

14

Как определить, когда регрессионная модель перегружена?

Когда вы выполняете эту работу, осознавая, что вы делаете, у вас появляется чувство, когда вы переоцениваете модель. Во-первых, вы можете отследить тренд или ухудшение скорректированного квадрата R модели. Также можно отследить аналогичное ухудшение значений p коэффициентов регрессии основных...

regression multivariate-analysis overfitting

14

OLS СИНИЙ. Но что, если мне наплевать на объективность и линейность?

Теорема Гаусса-Маркова говорит нам, что оценка OLS является наилучшей линейной несмещенной оценкой для модели линейной регрессии. Но предположим, что меня не волнует линейность и непредвзятость. Тогда есть ли какая-либо другая (возможно, нелинейная / смещенная) оценка для модели линейной регрессии,...

regression unbiased-estimator

14

Объяснить корректировку модели на простом английском

Читая о методах и результатах статистического анализа, особенно в эпидемиологии, я очень часто слышу о корректировке или контроле моделей. Как бы вы объяснили не статистику цель этого? Как вы интерпретируете свои результаты после контроля определенной переменной? Небольшой проход в Stata или R, или...

regression modeling epidemiology

14

Интерпретация вывода drop1 в R

В R drop1команда выводит что-то аккуратное. Эти две команды должны получить какой-то вывод: example(step)#-> swiss drop1(lm1, test="F") Моя выглядит так: > drop1(lm1, test="F") Single term deletions Model: Fertility ~ Agriculture + Examination + Education + Catholic + Infant.Mortality Df Sum...

r regression self-study stepwise-regression

14

Вменяемая ступенчатая регрессия?

Предположим, я хочу построить двоичный классификатор. У меня есть несколько тысяч функций и только несколько десятков образцов. Исходя из знания предметной области, у меня есть веские основания полагать, что метка класса может быть точно предсказана с использованием всего лишь нескольких функций,...

regression logistic multiple-comparisons stepwise-regression

14

Сравнение логистических коэффициентов на моделях с различными зависимыми переменными?

Это дополнительный вопрос из того, который я задал пару дней назад . Я чувствую, что это ставит другой взгляд на проблему, поэтому перечислил новый вопрос. Вопрос в том, могу ли я сравнить величину коэффициентов по моделям с различными зависимыми переменными? Например, на одном примере скажем, что...

regression logistic