Вопросы с тегом «model-selection»

23
Почему доказательство Уилкса 1938 года не работает для неправильно определенных моделей?

В известной работе 1938 года (« Распределение отношения правдоподобия для большой выборки при проверке составных гипотез », Анналы математической статистики, 9: 60–62) Самуэль Уилкс вывел асимптотическое распределение в (логарифмическое отношение правдоподобия) для вложенных гипотез в...

22
AIC или p-значение: какой выбрать для выбора модели?

Я новичок в этой вещи R, но не уверен, какую модель выбрать. Я сделал пошаговую регрессию вперед, выбирая каждую переменную на основе самой низкой AIC. Я придумал 3 модели, в которых я не уверен, какая из них «лучшая». Model 1: Var1 (p=0.03) AIC=14.978 Model 2: Var1 (p=0.09) + Var2 (p=0.199) AIC =...

22
Выбор среди правильных правил подсчета очков

В большинстве ресурсов о правильных правилах оценки упоминается ряд различных правил оценки, таких как потеря журнала, оценка Бриера или сферическая оценка. Тем не менее, они часто не дают больших указаний на различия между ними. (Приложение A: Википедия .) Выбор модели, которая максимизирует...

22
Лучший подход для выбора модели байесовской или перекрестной проверки?

При попытке выбора между различными моделями или количеством функций, например, для прогнозирования, я могу придумать два подхода. Разделите данные на обучающие и тестовые наборы. Еще лучше использовать начальную загрузку или перекрестную проверку в k-кратном порядке. Каждый раз тренируйтесь на...

22
Стабильность модели при решении большой проблемы , small

Вступление: У меня есть набор данных с классической «большой p, маленький n проблема». Количество доступных выборок n = 150, а количество возможных предикторов p = 400. Результат - непрерывная переменная. Я хочу найти самые «важные» дескрипторы, то есть те, которые являются лучшими кандидатами для...

21
Выбор модели с логистической регрессией Ферт

В небольшом наборе данных ( ), с которым я работаю, несколько переменных дают мне идеальный прогноз / разделение . Таким образом, я использую логистическую регрессию Фёрта для решения этой проблемы.n ∼ 100N~100n\sim100 Если я выберу лучшую модель по AIC или BIC , должен ли я включить штрафной штраф...

21
Перекрестная проверка (обобщение ошибок) после выбора модели

Примечание: регистр n >> p Я читаю Элементы статистического обучения, и есть различные упоминания о «правильном» способе перекрестной проверки (например, стр. 60, стр. 245). В частности, мой вопрос заключается в том, как оценить итоговую модель (без отдельного набора тестов) с использованием...

21
Как спроецировать новый вектор на пространство PCA?

После выполнения анализа главных компонентов (PCA) я хочу спроецировать новый вектор на пространство PCA (т.е. найти его координаты в системе координат PCA). Я рассчитал PCA на языке R, используя prcomp. Теперь я должен быть в состоянии умножить свой вектор на матрицу вращения PCA. Должны ли...

21
Анализировать графики ACF и PACF

Я хочу проверить, правильно ли я анализирую свои графики ACF и PACF: Фон: (Reff: Филип Ханс Фрэнсис, 1998) Поскольку ACF и PACF показывают значительные значения, я предполагаю, что ARMA-модель удовлетворит мои потребности ACF может использоваться для оценки MA-части, т.е. q-значения, PACF может...

20
Каковы правильные значения для точности и отзыва в крайних случаях?

Точность определяется как: p = true positives / (true positives + false positives) Является ли это исправить , что, как true positivesи false positivesподход 0, точность приближается к 1? Тот же вопрос для отзыва: r = true positives / (true positives + false negatives) В настоящее время я выполняю...

20
Когда исключить термин из регрессионной модели?

Может кто-нибудь посоветовать, если имеет смысл следующее: Я имею дело с обычной линейной моделью с 4 предикторами. Я в раздумье, отбросить ли наименее значимый термин. Это значение чуть более 0,05. Я высказался за то, чтобы привести его в соответствие с этим: умножение оценки этого термина на...

19
Может ли регуляризация быть полезной, если мы заинтересованы только в моделировании, а не в прогнозировании?

Может ли регуляризация быть полезной, если мы заинтересованы только в оценке (и интерпретации) параметров модели, а не в прогнозировании или прогнозировании? Я вижу, как регуляризация / перекрестная проверка чрезвычайно полезна, если ваша цель состоит в том, чтобы делать хорошие прогнозы на основе...

19
Как выбрать структуру со случайными и фиксированными эффектами в линейных смешанных моделях?

Рассмотрим следующие данные из двустороннего дизайна предметов: df <- "http://personality-project.org/r/datasets/R.appendix4.data" df <- read.table(df,header=T) head(df) Observation Subject Task Valence Recall 1 1 Jim Free Neg 8 2 2 Jim Free Neu 9 3 3 Jim Free Pos 5 4 4 Jim Cued Neg 7 5 5 Jim...

19
Меры сложности модели

Как мы можем сравнить сложность двух моделей с одинаковым количеством параметров? Изменить 09/19 : Чтобы уточнить, сложность модели является мерой того, насколько трудно учиться на ограниченных данных. Когда две модели в равной степени соответствуют существующим данным, модель с меньшей сложностью...

18
Определение функции подбора кривой наилучшего соответствия из линейных, экспоненциальных и логарифмических функций

Контекст: Из вопроса об обмене стеками по математике (могу ли я построить программу) кто-то имеет набор точек и хочет подогнать к нему кривую, линейную, экспоненциальную или логарифмическую. Обычный метод состоит в том, чтобы начать с выбора одного из них (который определяет модель), а затем...

18
Парадокс в выборе модели (AIC, BIC, объяснить или предсказать?)

Прочитав книгу Галита Шмуэли «Объяснить или предсказать» (2010), я озадачен очевидным противоречием. Есть три помещения, Выбор модели на основе BIC по сравнению с BIC (конец стр. 300 - начало стр. 301): проще говоря, AIC следует использовать для выбора модели, предназначенной для прогнозирования, в...

17
Правильно ли использовать матрицу корреляции для выбора предикторов регрессии?

Несколько дней назад мой психолог-исследователь рассказал мне о своем методе выбора переменных для модели линейной регрессии. Думаю, это нехорошо, но мне нужно попросить кого-нибудь еще убедиться. Метод таков: Посмотрите на матрицу корреляции между всеми переменными (включая зависимую переменную Y)...

17
Построение и отбор моделей с использованием Hosmer et al. 2013. Прикладная логистическая регрессия в R

Это мой первый пост на StackExchange, но я уже давно использую его в качестве ресурса, я сделаю все возможное, чтобы использовать соответствующий формат и внести соответствующие изменения. Кроме того, это вопрос, состоящий из нескольких частей. Я не был уверен, должен ли я разделить вопрос на...

17
БИК пытается найти настоящую модель?

Этот вопрос является продолжением или попыткой прояснить возможную путаницу в отношении темы, которую я и многие другие находим немного трудной в отношении различий между AIC и BIC. В очень хорошем ответе @Dave Kellen на эту тему ( /stats//a/767/30589 ) мы читаем: Ваш вопрос подразумевает, что AIC...