Вопросы с тегом «model-selection»

13
Использование информационной геометрии для определения расстояний и объемов ... полезно?

Я натолкнулся на большое количество литературы, в которой пропагандируется использование информационной метрики Фишера в качестве естественной локальной метрики в пространстве распределений вероятностей, а затем ее интеграция для определения расстояний и объемов. Но действительно ли эти...

13
Понимание AIC и критерий Шварца

Я управляю логистической моделью. Фактический набор данных модели содержит более 100 переменных, но я выбираю набор тестовых данных, в котором имеется около 25 переменных. До этого я также сделал набор данных, который имел 8-9 переменных. Мне говорят, что значения AIC и SC можно использовать для...

13
Понимание начальной загрузки для проверки и выбора модели

Мне кажется, я понимаю, как работают основы самозагрузки , но я не уверен, что понимаю, как я могу использовать самозагрузку для выбора модели или чтобы избежать переобучения. Например, для выбора модели вы бы просто выбрали модель, которая дает наименьшую ошибку (может быть, дисперсию?) Во всех...

13
Есть ли обстоятельства, в которых следует использовать ступенчатую регрессию?

В прошлом поэтапная регрессия использовалась во многих биомедицинских работах, но, похоже, она улучшается благодаря лучшему пониманию многих ее проблем. Однако многие старые рецензенты все еще просят об этом. В каких обстоятельствах ступенчатая регрессия играет свою роль и должна использоваться,...

13
Что такое чанк-тесты?

В ответ на вопрос о выборе модели в наличии мультиколлинеарности , Франк Харрелл предложил : Поместите все переменные в модель, но не проверяйте влияние одной переменной, скорректированной с учетом влияния конкурирующих переменных ... Кусочные тесты конкурирующих переменных являются мощными, потому...

13
Противоречивые подходы к выбору переменных: AIC, p-значения или оба?

Из того, что я понимаю, выбор переменных на основе p-значений (по крайней мере, в контексте регрессии) является в высшей степени ошибочным. Похоже, что выбор переменных на основе AIC (или аналогичных) также считается ошибочным по некоторым причинам, хотя это кажется немного неясным (например, см....

13
Термины взаимодействия и полиномы высших порядков

Если бы меня интересовало согласование двусторонних взаимодействий между линейной объясняющей переменной и другой объясняющей переменной b, которая имеет квадратичную связь с зависимой переменной y , мне бы пришлось включить как взаимодействие с квадратичным компонентом, так и взаимодействие с...

13
Можете ли вы сравнить значения AIC, если модели основаны на одном и том же наборе данных?

Я делаю некоторые прогнозы в R, используя пакет прогнозов Роба Хиндмана . Бумага, принадлежащая упаковке, может быть найдена здесь . В статье после объяснения алгоритмов автоматического прогнозирования авторы реализуют алгоритмы на одном и том же наборе данных. Однако, после оценки как...

13
Линейная и нелинейная регрессия

У меня есть набор значений и которые теоретически связаны экспоненциально:xxxyyy y=axby=axby = ax^b Одним из способов получения коэффициентов является применение натуральных логарифмов с обеих сторон и подгонка линейной модели: > fit <- lm(log(y)~log(x)) > a <- exp(fit$coefficients[1])...

13
Гамма GLM с логарифмической связью против гауссовой GLM с логарифмической связью против LM с логарифмическим преобразованием

Из моих результатов видно, что GLM Gamma отвечает большинству допущений, но стоит ли это значительного улучшения по сравнению с лог-преобразованным LM? Большая часть литературы, которую я нашел, посвящена пуассоновским или биномиальным GLM. Я нашел статью ОЦЕНКА ОБОБЩЕНИЙ ОБОБЩЕННОЙ ЛИНЕЙНОЙ МОДЕЛИ...

13
Как сравнить модели на основе AIC?

У нас есть две модели, которые используют один и тот же метод для вычисления логарифмической вероятности, и AIC для одной ниже, чем другой. Тем не менее, тот с более низким AIC интерпретировать гораздо сложнее. У нас возникают проблемы с принятием решения, стоит ли вводить сложность, и мы судили об...

13
Объясните шаги алгоритма LLE (локальное линейное вложение)?

Я понимаю, что основной принцип, лежащий в основе алгоритма LLE, состоит из трех этапов. Нахождение окрестности каждой точки данных по некоторой метрике, такой как k-nn. Найти веса для каждого соседа, которые обозначают влияние, которое сосед оказывает на точку данных. Построить низкоразмерное...

13
В чем смысл одномерной регрессии до многомерной регрессии?

В настоящее время я работаю над проблемой, в которой у нас небольшой набор данных, и меня интересует причинно-следственное влияние лечения на результат. Мой консультант поручил мне выполнить одномерную регрессию для каждого предиктора с результатом в качестве ответа, а затем назначением лечения в...

12
Когда мне следует беспокоиться о парадоксе Джеффриса-Линдли в выборе байесовской модели?

Я рассматриваю большое (но конечное) пространство моделей различной сложности, которые я исследую с помощью RJMCMC . Приоритет вектора параметров для каждой модели достаточно информативен. В каких случаях (если таковые имеются) я должен беспокоиться о парадоксе Джеффриса-Линдли в пользу более...

12
Как использовать анализ главных компонентов для выбора переменных для регрессии?

В настоящее время я использую анализ основных компонентов, чтобы выбрать переменные для моделирования. В настоящий момент я делаю измерения A, B и C в своих экспериментах. Что я действительно хочу знать: могу ли я сделать меньше измерений и прекратить запись C и / B, чтобы сэкономить время и...

12
Различия между PROC Mixed и lme / lmer в R - степени свободы

Примечание: этот вопрос является репостом, так как мой предыдущий вопрос пришлось удалить по юридическим причинам. Сравнивая PROC MIXED из SAS с функцией lmeиз nlmeпакета в R, я наткнулся на некоторые довольно запутанные различия. Более конкретно, степени свободы в разных тестах различаются между...

12
Выбор модели PCA с использованием AIC (или BIC)

Я хочу использовать Информационный критерий Акаике (AIC), чтобы выбрать соответствующее количество факторов для извлечения в PCA. Единственная проблема заключается в том, что я не уверен, как определить количество параметров. Рассмотрим матрицу , где представляет количество переменных, а -...

12
AIC для не вложенных моделей: нормализующая константа

АИК определяется как , где θ является оценкой максимального правдоподобия и р является размерность пространства параметров. Для оценки θА яС= - 2 журнала( L ( θ^) ) + 2 рAIC=−2log⁡(L(θ^))+2pAIC=-2 \log(L(\hat\theta))+2pθ^θ^\hat\thetaпppθθ\thetaобычно пренебрегают постоянным фактором плотности. Это...

12
Байесовский против MLE, проблема переоснащения

В книге Бишопа по PRML он говорит, что переоснащение - это проблема с оценкой максимального правдоподобия (MLE), и байесовский может ее избежать. Но я думаю, что переоснащение - это проблема скорее выбора модели, а не метода, используемого для оценки параметров. То есть, предположим, что у меня...

12
Точный критерий Фишера и гипергеометрическое распределение

Я хотел лучше понять точный критерий Фишера, поэтому я разработал следующий пример игрушки, где f и m соответствуют мужской и женской части, а n и y соответствуют «потреблению соды», например: > soda_gender f m n 0 5 y 5 0 Очевидно, это резкое упрощение, но я не хотел, чтобы контекст мешал....