Вопросы с тегом «model-selection»

34
Что означает показатель по информационному критерию Акаике (AIC) для модели?

Я видел здесь несколько вопросов о том, что это значит с точки зрения непрофессионала, но они слишком непрофессиональны для моей цели здесь. Я пытаюсь математически понять, что означает оценка AIC. Но в то же время я не хочу строгого доказательства, которое заставило бы меня не видеть более важные...

34
Интеллектуальный анализ данных: как мне найти функциональную форму?

Мне любопытно , повторяемых процедур , которые могут быть использованы , чтобы обнаружить функциональную форму функции , y = f(A, B, C) + error_termгде мой единственный вход множество наблюдений ( y, A, Bи C). Обратите внимание, что функциональная форма fнеизвестна. Рассмотрим следующий набор...

33
Что такое апостериорные прогностические проверки и что делает их полезными?

Я понимаю, что такое апостериорное предиктивное распределение , и я читал о апостериорных прогностических проверках , хотя мне пока не ясно, что он делает. Что такое задняя предиктивная проверка? Почему некоторые авторы говорят, что выполнение апостериорных прогностических проверок "использует...

32
Рекомендации AIC при выборе модели

Обычно я использую BIC, так как я понимаю, что он ценит скупость сильнее, чем AIC. Однако сейчас я решил использовать более комплексный подход и хотел бы также использовать AIC. Я знаю, что Raftery (1995) представил хорошие рекомендации для различий BIC: 0-2 - слабое, 2-4 - положительное...

31
Должна ли скупость действительно оставаться золотым стандартом?

Просто мысль: Экономные модели всегда были стандартным выбором при выборе модели, но насколько этот подход устарел? Мне любопытно, насколько наша склонность к скупости является пережитком времени абаки и правил скольжения (или, что более серьезно, нетрадиционных компьютеров). Сегодняшние...

31
Неправильное использование перекрестной проверки (представление отчета о наилучшем значении гиперпараметра)

Недавно я натолкнулся на статью, в которой предлагается использовать классификатор k-NN для конкретного набора данных. Авторы использовали все доступные образцы данных, чтобы выполнить перекрестную проверку в k-кратном размере для различных значений k и сообщить результаты перекрестной проверки...

31
Можно ли рассчитать AIC и BIC для моделей лассо-регрессии?

Можно ли рассчитать значения AIC или BIC для моделей лассо-регрессии и других регуляризованных моделей, где параметры только частично входят в уравнение. Как определить степени свободы? Я использую R для подбора моделей регрессии Лассо с помощью glmnet()функции из glmnetпакета, и я хотел бы знать,...

30
следует ли изменять масштаб индикатора / двоичных / фиктивных предикторов для LASSO

Для LASSO (и других процедур выбора модели) важно изменить масштаб предикторов. Общая рекомендация я следую просто использовать 0, 1 среднее стандартное отклонение нормализации для непрерывных переменных. Но что тут делать с чайниками? Например, некоторые прикладные примеры из той же (отличной)...

27
Как измерить / оценить «важность переменной» при использовании CART? (особенно используя {rpart} из R)

При построении модели CART (в частности, дерева классификации) с использованием rpart (в R) часто бывает интересно узнать, какова важность различных переменных, введенных в модель. Таким образом, мой вопрос: какие общие меры существуют для ранжирования / измерения важности переменных участвующих...

27
Может ли AIC сравнивать разные модели?

Я использую AIC (информационный критерий Акаике) для сравнения нелинейных моделей в R. Допустимо ли сравнивать AIC разных типов моделей? В частности, я сравниваю модель, подобранную с помощью glm, с моделью со случайным термином эффекта, подобранной с помощью glmer (lme4). Если нет, то есть ли...

27
Соответствующие остаточные степени свободы после отбрасывания членов из модели

Я размышляю над обсуждением этого вопроса и, в частности, комментарием Фрэнка Харрелла о том, что для оценки дисперсии в сокращенной модели (т. Е. Той, в которой ряд объясняющих переменных были проверены и отклонены) следует использовать Обобщенные степени свободы Йе . Профессор Харрелл указывает,...

26
Предварительные условия для сравнения моделей AIC

Какие именно предварительные условия необходимо выполнить для сравнения моделей AIC для работы? Я только пришел к этому вопросу, когда я сделал сравнение, как это: > uu0 = lm(log(usili) ~ rok) > uu1 = lm(usili ~ rok) > AIC(uu0) [1] 3192.14 > AIC(uu1) [1] 14277.29 Таким образом, я...

25
Решение проблемы неопределенности модели

Мне было интересно, как байесовцы в сообществе CrossValidated рассматривают проблему неопределенности модели и как они предпочитают с ней бороться? Я постараюсь изложить свой вопрос в двух частях: Насколько важно (по вашему опыту / мнению) иметь дело с неопределенностью модели? Я не нашел ни одной...

24
Какова польза от рассмотрения фактора как случайного в смешанной модели?

У меня есть проблема, заключающаяся в использовании преимуществ маркировки модельного фактора как случайного по нескольким причинам. Мне кажется, что почти во всех случаях оптимальное решение состоит в том, чтобы рассматривать все факторы как фиксированные. Во-первых, различие между фиксированным и...

24
У вас есть глобальное видение тех методов анализа?

В настоящее время я работаю над проектом, в котором, как и всем нам, мне нужно понять, как выход связан с входом . Особенность в том, что данные выдаются мне по одному фрагменту за раз, поэтому я хочу обновлять свой анализ каждый раз, когда получаю новый . Я считаю, что это называется «оперативной»...

23
AIC против перекрестной проверки во временных рядах: небольшой пример

Я заинтересован в выборе модели в настройке временных рядов. Для конкретности предположим, что я хочу выбрать модель ARMA из пула моделей ARMA с различными порядками запаздывания. Конечная цель - прогнозирование . Выбор модели может быть сделан перекрестная проверка, использование информационных...

23
Почему доказательство Уилкса 1938 года не работает для неправильно определенных моделей?

В известной работе 1938 года (« Распределение отношения правдоподобия для большой выборки при проверке составных гипотез », Анналы математической статистики, 9: 60–62) Самуэль Уилкс вывел асимптотическое распределение в (логарифмическое отношение правдоподобия) для вложенных гипотез в...

23
Стабильность темы в моделях темы

Я работаю над проектом, в котором я хочу извлечь некоторую информацию о содержании серии открытых эссе. В этом конкретном проекте 148 человек написали эссе о гипотетической организации студентов в рамках более крупного эксперимента. Хотя в моей области (социальная психология) типичным способом...