Вопросы с тегом «regression»

15
Сравнение Ньюи-Уэста (1987) и Хансена-Ходрика (1980)

Вопрос: Каковы основные различия и сходства между использованием стандартных ошибок Newey-West (1987) и Hansen-Hodrick (1980)? В каких ситуациях одна из них должна быть предпочтительнее другой? Примечания: Я знаю, как работает каждая из этих процедур настройки; однако я еще не нашел ни одного...

15
Является ли сумма двух деревьев решений эквивалентной одному дереву решений?

Предположим, у нас есть два дерева регрессии (дерево A и дерево B), которые отображают входные данные на выходные данные . Пусть \ hat {y} = f_A (x) для дерева A и f_B (x) для дерева B. Каждое дерево использует двоичные разбиения с гиперплоскостями в качестве разделяющих функций.x∈Rdx∈Rdx \in...

15
Нейронные сети против всего остального

Я не нашел удовлетворительного ответа на этот вопрос от Google . Конечно, если у меня есть данные порядка нескольких миллионов, то глубокое обучение - это путь. И я прочитал, что, когда у меня нет больших данных, тогда, возможно, лучше использовать другие методы в машинном обучении. Приведенная...

15
Доказательство эквивалентных формул гребневой регрессии

Я прочитал самые популярные книги в области статистического обучения 1- Элементы статистического обучения. 2- Введение в статистическое обучение . Оба упоминают, что у регрессии гребня есть две формулы, которые эквивалентны. Есть ли понятное математическое доказательство этого результата? Я также...

15
Расчет доверительных интервалов для логистической регрессии

Я использую биномиальную логистическую регрессию , чтобы определить , если воздействие has_xили has_yвоздействий на вероятность того , что пользователь нажмет на что - то. Моя модель следующая: fit = glm(formula = has_clicked ~ has_x + has_y, data=df, family = binomial()) Это вывод из моей модели:...

15
Зачем нужны предположения в линейной регрессии?

В линейной регрессии мы делаем следующие предположения Среднее значение ответа E(Yi)E(Yi)E(Y_i) каждого набора значений предикторов (x1i,x2i,…)(x1i,x2i,…)(x_{1i}, x_{2i},…) является линейной функцией предикторов. Ошибки являются независимыми.εiεiε_i Ошибки при каждом наборе значений предикторов (x_...

15
Когда использовать GAM против GLM

Я понимаю, что это может быть потенциально широкий вопрос, но мне было интересно, существуют ли обобщенные предположения, которые указывают на использование GAM (Обобщенная аддитивная модель) над GLM (Обобщенная линейная модель)? Кто-то недавно сказал мне, что GAM следует использовать только тогда,...

15
Являются ли тесты на избыточную дисперсию в GLM действительно * полезными *?

Феномен «чрезмерной дисперсии» в GLM возникает всякий раз, когда мы используем модель, которая ограничивает дисперсию переменной отклика, и данные демонстрируют большую дисперсию, чем позволяет ограничение модели. Это обычно происходит при моделировании данных подсчета с использованием Poisson GLM,...

15
Почему предположение о нормальности в линейной регрессии

Мой вопрос очень прост: почему мы выбираем нормальное в качестве распределения, которому следует термин ошибки в предположении о линейной регрессии? Почему мы не выбираем других, как униформу, т или...

15
Каковы преимущества линейной регрессии над квантильной регрессией?

Модель линейной регрессии делает кучу предположений, что квантильная регрессия не делает, и, если предположения о линейной регрессии соблюдаются, то моя интуиция (и некоторый очень ограниченный опыт) состоит в том, что срединная регрессия даст почти идентичные результаты как линейная регрессия....

15
Почему усадка действительно работает, что такого особенного в 0?

На этом сайте уже есть пост, посвященный той же проблеме: почему работает усадка? Но, хотя ответы и популярны, я не верю, что суть вопроса действительно решена. Совершенно очевидно, что введение некоторого смещения в оценку приводит к снижению дисперсии и может улучшить качество оценки. Тем не...

15
Какая кривая (или модель) должна соответствовать моим процентным данным?

Я пытаюсь создать фигуру, которая показывает связь между вирусными копиями и освещением генома (GCC). Вот как выглядят мои данные: Сначала я только построил линейную регрессию, но мои руководители сказали мне, что это неправильно, и попробовал сигмоидальную кривую. Поэтому я сделал это с помощью...

14
Можно ли сделать модели CART надежными?

Коллега в моем офисе сказал мне сегодня: «Модели деревьев не хороши, потому что их ловят экстремальные наблюдения». Поиск здесь привел к этой теме, которая в основном поддерживает претензию. Что приводит меня к вопросу - в какой ситуации модель CART может быть надежной и как это...

14
МЕНЬШЕ, что позволяет разрывы

Существует ли метод моделирования, такой как LOESS, который допускает ноль, один или несколько разрывов, где время разрывов не известно априори? Если метод существует, есть ли существующая реализация в R?...

14
Как определить, когда регрессионная модель перегружена?

Когда вы выполняете эту работу, осознавая, что вы делаете, у вас появляется чувство, когда вы переоцениваете модель. Во-первых, вы можете отследить тренд или ухудшение скорректированного квадрата R модели. Также можно отследить аналогичное ухудшение значений p коэффициентов регрессии основных...

14
OLS СИНИЙ. Но что, если мне наплевать на объективность и линейность?

Теорема Гаусса-Маркова говорит нам, что оценка OLS является наилучшей линейной несмещенной оценкой для модели линейной регрессии. Но предположим, что меня не волнует линейность и непредвзятость. Тогда есть ли какая-либо другая (возможно, нелинейная / смещенная) оценка для модели линейной регрессии,...

14
Объяснить корректировку модели на простом английском

Читая о методах и результатах статистического анализа, особенно в эпидемиологии, я очень часто слышу о корректировке или контроле моделей. Как бы вы объяснили не статистику цель этого? Как вы интерпретируете свои результаты после контроля определенной переменной? Небольшой проход в Stata или R, или...

14
Интерпретация вывода drop1 в R

В R drop1команда выводит что-то аккуратное. Эти две команды должны получить какой-то вывод: example(step)#-> swiss drop1(lm1, test="F") Моя выглядит так: > drop1(lm1, test="F") Single term deletions Model: Fertility ~ Agriculture + Examination + Education + Catholic + Infant.Mortality Df Sum...

14
Вменяемая ступенчатая регрессия?

Предположим, я хочу построить двоичный классификатор. У меня есть несколько тысяч функций и только несколько десятков образцов. Исходя из знания предметной области, у меня есть веские основания полагать, что метка класса может быть точно предсказана с использованием всего лишь нескольких функций,...

14
Сравнение логистических коэффициентов на моделях с различными зависимыми переменными?

Это дополнительный вопрос из того, который я задал пару дней назад . Я чувствую, что это ставит другой взгляд на проблему, поэтому перечислил новый вопрос. Вопрос в том, могу ли я сравнить величину коэффициентов по моделям с различными зависимыми переменными? Например, на одном примере скажем, что...