Вопросы с тегом «predictive-models»

19

Прогнозирующее моделирование. Должны ли мы заботиться о смешанном моделировании?

Для прогностического моделирования, нужно ли нам заниматься статистическими понятиями, такими как случайные эффекты и отсутствие независимости наблюдений (повторные измерения)? Например.... У меня есть данные из 5 кампаний прямой почтовой рассылки (проводившихся в течение года) с различными...

19

Повышение: почему скорость обучения называется параметром регуляризации?

Параметр скорости обучения ( ) в Gradient Boosting сокращает вклад каждой новой базовой модели - обычно мелкого дерева - который добавляется в серию. Было показано, что резко повышается точность набора тестов, что понятно, так как при меньших шагах минимум функции потерь может быть достигнут более...

machine-learning data-mining predictive-models boosting overfitting

18

Определение функции подбора кривой наилучшего соответствия из линейных, экспоненциальных и логарифмических функций

Контекст: Из вопроса об обмене стеками по математике (могу ли я построить программу) кто-то имеет набор точек и хочет подогнать к нему кривую, линейную, экспоненциальную или логарифмическую. Обычный метод состоит в том, чтобы начать с выбора одного из них (который определяет модель), а затем...

regression predictive-models model-selection curve-fitting

18

Получение формулы для пределов прогнозирования в линейной модели (т. Е. Интервалы прогнозирования)

Давайте возьмем следующий пример: set.seed(342) x1 <- runif(100) x2 <- runif(100) y <- x1+x2 + 2*x1*x2 + rnorm(100) fit <- lm(y~x1*x2) Это создает модель y на основе x1 и x2, используя регрессию OLS. Если мы хотим предсказать y для данного x_vec, мы можем просто использовать формулу,...

r regression predictive-models prediction-interval

17

Модель выживания для прогнозирования оттока - изменяющиеся во времени предикторы?

Я рассчитываю построить прогностическую модель для прогнозирования оттока и использовать модель выживания с дискретным временем, адаптированную к набору данных за период человека (одна строка для каждого клиента и дискретный период, в котором они находились под угрозой, с показателем для события -...

survival predictive-models churn

17

Как интерпретировать вывод предиката .coxph?

После подбора кокс-модели можно делать прогнозы и получать относительный риск новых данных. Что я не понимаю, так это то, как относительный риск рассчитывается для человека и к чему он относится (то есть для среднего населения)? Любые рекомендации по ресурсам, которые помогут понять (я не очень...

predictive-models relative-risk cox-model

17

Надежные методы действительно лучше?

У меня есть две группы субъектов, A и B, каждая из которых имеет размер около 400 и около 300 предикторов. Моя цель - построить модель прогнозирования для бинарной переменной ответа. Мой клиент хочет увидеть результат применения модели, построенной из A на B. (В своей книге «Стратегии...

pca logistic predictive-models robust

17

Stepwise AIC - Существуют ли противоречия вокруг этой темы?

Я читал бесчисленные посты на этом сайте, которые невероятно против использования пошагового выбора переменных, используя любой критерий, будь то на основе p-значений, AIC, BIC и т. Д. Я понимаю, почему эти процедуры в целом достаточно плохи для выбора переменных. вероятно, знаменитый пост Ганга...

forecasting predictive-models arima aic stepwise-regression

16

В чем разница между оценкой максимального правдоподобия и градиентным спуском?

Каковы преимущества и недостатки обоих

maximum-likelihood predictive-models optimization gradient-descent

16

Самая быстрая реализация SVM

Больше общего вопроса. Я использую rbf SVM для прогнозного моделирования. Я думаю, что моя текущая программа определенно нуждается в ускорении. Я использую Scikit Learn с грубым, чтобы точный поиск сетки + перекрестная проверка. Каждый запуск SVM занимает около минуты, но со всеми итерациями я все...

machine-learning svm predictive-models scikit-learn kernel-trick

16

О Джордже Боксе, Галите Шмуэли и научном методе?

(Этот вопрос может показаться, что он лучше подходит для Philosophy SE. Я надеюсь, что статистики смогут уточнить мои неправильные представления о высказываниях Бокса и Шмуэли, поэтому я публикую его здесь). Джордж Бокс (из известности ARIMA) сказал: «Все модели ошибочны, но некоторые полезны»....

predictive-models aic bic philosophical explanatory-models

15

Как сделать перекрестную проверку с помощью модели пропорциональных рисков Кокса?

Предположим, что я построил модель прогнозирования возникновения конкретной болезни в одном наборе данных (набор данных построения модели) и теперь хочу проверить, насколько хорошо модель работает в новом наборе данных (набор данных проверки). Для модели, построенной с логистической регрессией, я...

predictive-models cross-validation survival roc

15

Является ли это мошенничеством, чтобы отбросить выбросы, основанные на диаграмме средней абсолютной ошибки, чтобы улучшить регрессионную модель

У меня есть модель прогнозирования, протестированная четырьмя методами, как вы можете видеть на рисунке ниже. Атрибут, который предсказывает модель, находится в диапазоне 0-8. Вы можете заметить, что во всех методах указаны один выброс верхней границы и три выброса нижней границы . Интересно,...

regression machine-learning multiple-regression predictive-models outliers

15

Минимизация смещения в объяснительном моделировании, почему? (Галита Шмуэли «Объяснять или предсказывать»)

Этот вопрос ссылается на статью Галита Шмуэли «Объяснить или предсказать» . В частности, в разделе 1.5 «Объяснения и предсказания различны» профессор Шмуэли пишет: При объяснительном моделировании основное внимание уделяется минимизации смещения для получения наиболее точного представления основной...

predictive-models inference bias unbiased-estimator explanatory-models

15

Почему это предсказание временного ряда «довольно плохое»?

Я пытаюсь научиться использовать нейронные сети. Я читал этот урок . После подбора нейронной сети по временному ряду, используя значение в для прогнозирования значения в момент времени t + 1, автор получает следующий график, где синяя линия - это временной ряд, зеленый - это прогноз данных поезда,...

time-series neural-networks predictive-models deep-learning prediction

14

Прогнозирующие модели: статистика не может превзойти машинное обучение? [закрыто]

Закрыто . Этот вопрос должен быть более сфокусированным . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он был сосредоточен только на одной проблеме, отредактировав этот пост . Закрыто 2 года назад . В настоящее время я слежу за магистерской...

machine-learning forecasting predictive-models prediction out-of-sample

14

Модель производительности в квантовом моделировании

Я использую квантильную регрессию (например, через gbmили quantregв R) - фокусируюсь не на медиане, а на верхнем квантиле (например, 75-й). Исходя из опыта прогнозного моделирования, я хочу измерить, насколько хорошо модель вписывается в набор тестов, и иметь возможность описать это для...

regression data-mining predictive-models quantile-regression

14

Карет глмнет против cv.glmnet

Кажется, существует большая путаница при сравнении использования glmnetвнутри caretдля поиска оптимальной лямбды и использования cv.glmnetдля выполнения той же задачи. Было задано много вопросов, например: Модель классификации train.glmnet против cv.glmnet? Как правильно использовать glmnet с...

r caret glmnet machine-learning neural-networks maximum softmax probability distributions mathematical-statistics random-variable cdf statistical-significance variance expected-value ratio sample-size reliability tolerance-interval wilcoxon-signed-rank self-study variance sampling mean machine-learning svm libsvm self-study sampling ranks data-visualization histogram machine-learning classification normal-distribution mathematical-statistics maximum-likelihood mixture predictive-models prediction seasonality

14

Прогнозирующая эффективность зависит больше от опыта аналитика данных, чем от метода?

Я сталкивался со слухами о том, что некоторые исследования показали, что эффективность прогностических моделей больше зависит от опыта аналитика данных с выбранным методом, чем от выбора метода. Другими словами, утверждается, что более важно, чтобы аналитик данных был знаком с выбранным методом,...

predictive-models method-comparison

14

Может ли метод случайного леса применяться к линейным регрессиям?

Случайные леса работают путем создания множества деревьев решений, где каждое дерево создается с использованием начальной загрузки исходных обучающих данных (выборка как входных переменных, так и наблюдений). Можно ли применить аналогичный процесс для линейной регрессии? Создайте k моделей линейной...

regression predictive-models ensemble