Вопросы с тегом «model-selection»

12

Когда уместно выбирать модели, сводя к минимуму AIC?

Хорошо известно, по крайней мере среди статистиков более высокого уровня, что модели со значениями статистики AIC в пределах определенного порога минимального значения следует рассматривать как соответствующие модели, минимизирующей статистику AIC. Например, в [1, с.221] находим Тогда модели с...

time-series model-selection aic

12

Байесовский против MLE, проблема переоснащения

В книге Бишопа по PRML он говорит, что переоснащение - это проблема с оценкой максимального правдоподобия (MLE), и байесовский может ее избежать. Но я думаю, что переоснащение - это проблема скорее выбора модели, а не метода, используемого для оценки параметров. То есть, предположим, что у меня...

bayesian model-selection overfitting

12

Точный критерий Фишера и гипергеометрическое распределение

Я хотел лучше понять точный критерий Фишера, поэтому я разработал следующий пример игрушки, где f и m соответствуют мужской и женской части, а n и y соответствуют «потреблению соды», например: > soda_gender f m n 0 5 y 5 0 Очевидно, это резкое упрощение, но я не хотел, чтобы контекст мешал....

fishers-exact hypergeometric clustering supervised-learning modeling econometrics r regression residuals heteroscedasticity independence distributions self-study matlab libsvm self-study conditional-probability conditional-expectation hypothesis-testing self-study multiple-comparisons mode statistical-significance chi-squared multiple-comparisons maximum-likelihood poisson-process optimization uncertainty genetic-algorithms bayesian model-selection overfitting maximum-likelihood optimization approximation r prediction model-evaluation r machine-learning survival neural-networks cox-model machine-learning bayesian bayesian-network hierarchical-bayesian pooling

12

В чем разница между «проверкой гипотез» и «выбором модели»?

В литературе оба термина часто используются как синонимы или переплетаются. Сейчас я пытаюсь найти четкое различие между обоими терминами. С моей точки зрения, гипотеза обычно выражается через модель. Поэтому, даже если мы проверяем гипотезу «ноль против альтернативы», с моей точки зрения, мы...

hypothesis-testing model-selection regression-strategies

12

Когда мне следует беспокоиться о парадоксе Джеффриса-Линдли в выборе байесовской модели?

Я рассматриваю большое (но конечное) пространство моделей различной сложности, которые я исследую с помощью RJMCMC . Приоритет вектора параметров для каждой модели достаточно информативен. В каких случаях (если таковые имеются) я должен беспокоиться о парадоксе Джеффриса-Линдли в пользу более...

bayesian model-selection mcmc prior improper-prior

12

Выбор переменной против выбора модели

Поэтому я понимаю, что выбор переменной является частью выбора модели. Но из чего конкретно состоит выбор модели? Это больше, чем следующее: 1) выберите дистрибутив для вашей модели 2) выбрать объясняющие переменные,? Я спрашиваю об этом, потому что я читаю статью Burnham & Anderson: AIC против...

feature-selection model-selection aic bic

11

Выбор модели ABC

Было показано, что выбор модели ABC с использованием байесовских факторов не рекомендуется из-за наличия ошибки, связанной с использованием сводной статистики. Заключение в этой статье основано на изучении поведения популярного метода аппроксимации байесовского фактора (алгоритм 2). Хорошо...

bayesian model-selection prediction abc

11

Что делать с коллинеарными переменными

Отказ от ответственности: это для домашнего проекта. Я пытаюсь найти лучшую модель для цен на алмазы, в зависимости от нескольких переменных, и у меня пока что есть довольно хорошая модель. Однако я столкнулся с двумя переменными, которые явно коллинеарны: >with(diamonds, cor(data.frame(Table,...

regression correlation self-study model-selection multicollinearity

11

Что мне делать, если значения AIC низкие и приблизительно равны?

Крис Чатфилд, чьи многочисленные качественные книги и газеты мне нравилось читать, в (1) дает следующий совет: Например, вероятно, следует сделать выбор между моделями временных рядов ARIMA с низкими и приблизительно равными значениями AIC, причем не в тех случаях, когда получается минимальный AIC,...

forecasting model-selection arima aic

11

Выбор модели в автономном режиме и онлайн-обучения

В последнее время я пытался узнать больше об онлайн-обучении (это абсолютно увлекательно!), И одна тема, которую я так и не смог понять, - как думать о выборе моделей в офлайновом и онлайн-контекстах. В частности, предположим , что мы тренируем классификатор в автономном режиме, на основе...

machine-learning model-selection online

11

Как выбрать наилучшее соответствие без чрезмерных данных? Моделирование бимодального распределения с N нормальными функциями и т. Д.

У меня есть явно бимодальное распределение значений, которое я стараюсь соответствовать. Данные могут хорошо соответствовать либо 2 нормальным функциям (бимодальным), либо 3 нормальным функциям. Кроме того, существует вероятная физическая причина для сопоставления данных с 3. Чем больше параметров...

distributions normal-distribution model-selection overfitting

11

Выбор байесовской модели в PyMC3

Я использую PyMC3 для запуска байесовских моделей на моих данных. Я новичок в байесовском моделировании, но, согласно сообщениям в некоторых блогах , Википедии и QA с этого сайта, кажется правильным подход использовать фактор Байеса и критерий BIC, чтобы иметь возможность выбрать, какая модель...

bayesian model-selection pymc

10

Существует ли статистика соответствия модели (например, AIC или BIC), которую можно использовать для абсолютных, а не просто относительных сравнений?

Я не очень знаком с этой литературой, поэтому, пожалуйста, прости меня, если это очевидный вопрос. Поскольку AIC и BIC зависят от максимизации вероятности, кажется, что они могут использоваться только для сравнительных сравнений между набором моделей, пытающихся соответствовать заданному набору...

model-selection aic bic

10

Сравните R-квадрат из двух разных моделей Random Forest

Я использую пакет randomForest в R для разработки модели случайного леса, чтобы попытаться объяснить непрерывный результат в «широком» наборе данных с большим количеством предикторов, чем выборок. В частности, я подгоняю одну модель RF, позволяющую процедуре выбрать из набора ~ 75 переменных...

r machine-learning hypothesis-testing model-selection random-forest

10

Стабильность модели в перекрестной проверке регрессионных моделей

С учетом множественных сгибов перекрестной проверки логистической регрессии и полученных в результате множественных оценок каждого коэффициента регрессии, как следует измерить, является ли предиктор (или набор предикторов) стабильным и значимым на основе коэффициента (ов) регрессии ? Отличается ли...

regression model-selection cross-validation

10

Вопросы об определении линейных смешанных моделей в R для данных повторных измерений с дополнительной структурой вложенности

Структура данных > str(data) 'data.frame': 6138 obs. of 10 variables: $ RT : int 484 391 422 516 563 531 406 500 516 578 ... $ ASCORE : num 5.1 4 3.8 2.6 2.7 6.5 4.9 2.9 2.6 7.2 ... $ HSCORE : num 6 2.1 7.9 1 6.9 8.9 8.2 3.6 1.7 8.6 ... $ MVMNT : Factor w/ 2 levels "_Withd","Appr": 2 2 1 1 2 1 2...

r mixed-model repeated-measures model-selection lme4-nlme

10

Байесовские факторы с неподходящими априорами

У меня есть вопрос относительно сравнения моделей с использованием байесовских факторов. Во многих случаях статистики заинтересованы в использовании байесовского подхода с неподходящими априорами (например, с некоторыми априорами Джеффриса и эталонными априорами). Мой вопрос заключается в том, что...

bayesian model-selection prior

10

Сравнение распределений производительности обобщения

Скажем, у меня есть два метода обучения для задачи классификации , и , и что я оцениваю их эффективность обобщения с помощью чего-то вроде повторной перекрестной проверки или начальной загрузки. Из этого процесса я получаю распределение оценок и для каждого метода по всем этим повторениям...

cross-validation model-selection

10

В чем принципиальная разница между этими двумя регрессионными моделями?

Предположим, у меня есть двумерные ответы со значительной корреляцией. Я пытаюсь сравнить два способа моделирования этих результатов. Один из способов - смоделировать разницу между двумя результатами: Другой способ - использовать или смоделировать их:...

r regression model-selection

10

Превосходство LASSO над прямым выбором / обратным устранением с точки зрения ошибки прогнозирования перекрестной проверки модели

Я получил три уменьшенные модели из оригинальной полной модели, используя выбор вперед устранение в обратном направлении Техника наказания L1 (LASSO) Для моделей, полученных с использованием прямого выбора / обратного исключения, я получил перекрестную валидацию оценки ошибки прогнозирования,...

cross-validation model-selection lasso stepwise-regression