Вопросы с тегом «model-selection»

10

В чем принципиальная разница между этими двумя регрессионными моделями?

Предположим, у меня есть двумерные ответы со значительной корреляцией. Я пытаюсь сравнить два способа моделирования этих результатов. Один из способов - смоделировать разницу между двумя результатами: Другой способ - использовать или смоделировать их:...

r regression model-selection

10

Превосходство LASSO над прямым выбором / обратным устранением с точки зрения ошибки прогнозирования перекрестной проверки модели

Я получил три уменьшенные модели из оригинальной полной модели, используя выбор вперед устранение в обратном направлении Техника наказания L1 (LASSO) Для моделей, полученных с использованием прямого выбора / обратного исключения, я получил перекрестную валидацию оценки ошибки прогнозирования,...

cross-validation model-selection lasso stepwise-regression

10

Обобщенный логарифмический критерий отношения правдоподобия для не вложенных моделей

Я понимаю, что если у меня есть две модели A и B и A вложено в B, то, учитывая некоторые данные, я могу подобрать параметры A и B с помощью MLE и применить обобщенный тест логарифмического отношения правдоподобия. В частности, распределение теста должно быть с степенями свободы , где есть разность...

maximum-likelihood model-selection likelihood-ratio

9

Вычисление лучшего подмножества предикторов для линейной регрессии

Какие методы доступны для выбора предикторов в многомерной линейной регрессии с подходящими предикторами, чтобы найти «оптимальное» подмножество предикторов без явного тестирования всех 2 p подмножеств? В «Прикладном анализе выживания» Хосмер и Лемешоу ссылаются на метод Кука, но я не могу найти...

modeling regression multivariable model-selection feature-selection

9

Рассчитать кривую ROC для данных

Итак, у меня есть 16 испытаний, в которых я пытаюсь идентифицировать человека по биометрической характеристике, используя расстояние Хэмминга. Мой порог установлен на 3,5. Мои данные ниже, и только пробная версия 1 является истинным положительным результатом: Trial Hamming Distance 1 0.34 2 0.37 3...

mathematical-statistics roc classification cross-validation pac-learning r anova survival hazard machine-learning data-mining hypothesis-testing regression random-variable non-independent normal-distribution approximation central-limit-theorem interpolation splines distributions kernel-smoothing r data-visualization ggplot2 distributions binomial random-variable poisson-distribution simulation kalman-filter regression lasso regularization lme4-nlme model-selection aic r mcmc dlm particle-filter r panel-data multilevel-analysis model-selection entropy graphical-model r distributions quantiles qq-plot svm matlab regression lasso regularization entropy inference r distributions dataset algorithms matrix-decomposition regression modeling interaction regularization expected-value exponential gamma-distribution mcmc gibbs probability self-study normality-assumption naive-bayes bayes-optimal-classifier standard-deviation classification optimization control-chart engineering-statistics regression lasso regularization regression references lasso regularization elastic-net r distributions aggregation clustering algorithms regression correlation modeling distributions time-series standard-deviation goodness-of-fit hypothesis-testing statistical-significance sample binary-data estimation random-variable interpolation distributions probability chi-squared predictor outliers regression modeling interaction

9

В какой настройке вы ожидаете, что модель, найденная LARS, будет наиболее отличаться от модели, найденной при исчерпывающем поиске?

Немного больше информации; Предположим, что вы знаете заранее, сколько переменных выбрать и что вы установили штраф за сложность в процедуре LARS, чтобы иметь ровно столько переменных с ненулевыми коэффициентами, вычислительные затраты не являются проблемой (общее количество переменных мало,...

regression model-selection

9

Учет дискретных или двоичных параметров в байесовском информационном критерии

BIC штрафует в зависимости от количества параметров. Что если некоторые из параметров являются своего рода переменными двоичного индикатора? Они считаются полными параметрами? Но я могу объединить двоичных параметров в одну дискретную переменную, которая принимает значения в . Они должны...

bayesian model-selection bic parameterization

9

Сокращение количества переменных в множественной регрессии

У меня есть большой набор данных, состоящий из значений нескольких сотен финансовых переменных, которые можно использовать в множественной регрессии для прогнозирования поведения индексного фонда во времени. Я хотел бы сократить число переменных до десяти или около того, сохраняя при этом как можно...

regression multivariate-analysis model-selection multiple-regression

9

Выбор модели и производительность модели в логистической регрессии

У меня есть вопрос о выборе модели и производительности модели в логистической регрессии. У меня есть три модели, основанные на трех разных гипотезах. Первые две модели (назовем их z и x) имеют только одну объясняющую переменную в каждой модели, а третья (назовем ее w) является более сложной. Я...

logistic model-selection cross-validation

9

Вычисление проблем, интерпретация regsubsets и общие вопросы о процедуре выбора модели

Я хочу выбрать модели, используя regsubsets(). У меня есть фрейм данных с именем olympiadaten (загруженные данные: http://www.sendspace.com/file/8e27d0 ). Я сначала присоединяю этот фрейм данных, а затем начинаю анализировать, мой код: attach(olympiadaten) library(leaps) a<-regsubsets(Gesamt ~...

r multiple-regression model-selection

9

Какое ядро SVM использовать для решения проблемы двоичной классификации?

Я начинающий, когда дело доходит до поддержки векторных машин. Существуют ли рекомендации, в которых говорится, какое ядро (например, линейное, полиномиальное) лучше всего подходит для конкретной задачи? В моем случае я должен классифицировать веб-страницы в зависимости от того, содержат ли они...

classification svm model-selection libsvm kernel-trick

9

Эквивалентность AIC и p-значений при выборе модели

В комментарии к ответу на этот вопрос было указано, что использование AIC при выборе модели эквивалентно использованию значения p 0,154. Я попробовал это в R, где я использовал «обратный» алгоритм выбора подмножества, чтобы выбросить переменные из полной спецификации. Во-первых, путем...

model-selection p-value aic

9

Когда правильное правило оценки является лучшей оценкой обобщения в условиях классификации?

Типичный подход к решению проблемы классификации состоит в том, чтобы идентифицировать класс моделей-кандидатов, а затем выполнить выбор модели с использованием некоторой процедуры, такой как перекрестная проверка. Обычно выбирается модель с наивысшей точностью или некоторая связанная функция,...

machine-learning model-selection error scoring-rules

9

Выбор оригинальной (?) Модели с k-кратным CV

При использовании k-кратного CV для выбора между регрессионными моделями я обычно вычисляю ошибку CV отдельно для каждой модели вместе со стандартной ошибкой SE, и выбираю простейшую модель в пределах 1 SE модели с наименьшей ошибкой CV (1 стандартное правило ошибки, см., например, здесь ). Однако...

regression cross-validation model-selection

9

Интерпретация значения AIC

Типичные значения AIC, которые я видел для логистических моделей, исчисляются тысячами, по меньшей мере, сотнями. например, на http://www.r-bloggers.com/how-to-perform-a-logistic-regression-in-r/ AIC составляет 727,39 Хотя всегда говорят, что AIC следует использовать только для сравнения моделей, я...

regression model-selection aic accuracy

9

Почему информационный критерий (не скорректированный

В моделях временных рядов, таких как ARMA-GARCH, для выбора подходящего лага или порядка модели используются разные информационные критерии, такие как AIC, BIC, SIC и т. Д. Мой вопрос очень прост, почему мы не используем скорректированный чтобы выбрать подходящую модель? Мы можем выбрать модель,...

regression time-series model-selection aic bic

9

Какая модель глубокого обучения может классифицировать категории, которые не являются взаимоисключающими

Примеры: у меня есть предложение в должностной инструкции: «Старший инженер Java в Великобритании». Я хочу использовать модель глубокого обучения, чтобы предсказать ее как 2 категории: English и IT jobs. Если я использую традиционную классификационную модель, она может предсказать только 1 метку с...

machine-learning deep-learning natural-language tensorflow sampling distance non-independent application regression machine-learning logistic mixed-model control-group crossover r multivariate-analysis ecology procrustes-analysis vegan regression hypothesis-testing interpretation chi-squared bootstrap r bioinformatics bayesian exponential beta-distribution bernoulli-distribution conjugate-prior distributions bayesian prior beta-distribution covariance naive-bayes smoothing laplace-smoothing distributions data-visualization regression probit penalized estimation unbiased-estimator fisher-information unbalanced-classes bayesian model-selection aic multiple-regression cross-validation regression-coefficients nonlinear-regression standardization naive-bayes trend machine-learning clustering unsupervised-learning wilcoxon-mann-whitney z-score econometrics generalized-moments method-of-moments machine-learning conv-neural-network image-processing ocr machine-learning neural-networks conv-neural-network tensorflow r logistic scoring-rules probability self-study pdf cdf classification svm resampling forecasting rms volatility-forecasting diebold-mariano neural-networks prediction-interval uncertainty

9

Выбор байесовской модели и вероятный интервал

У меня есть набор данных с тремя переменными, где все переменные являются количественными. Давайте назовем это , и . Я подгоняю регрессионную модель в байесовской перспективе через MCMC сх 1 х 2yyyx1x1x_1x2x2x_2rjags Я сделал предварительный анализ, и график рассеяния подсказывает, что следует...

bayesian feature-selection model-selection model credible-interval