Вопросы с тегом «predictive-models»

19
Прогнозирующее моделирование. Должны ли мы заботиться о смешанном моделировании?

Для прогностического моделирования, нужно ли нам заниматься статистическими понятиями, такими как случайные эффекты и отсутствие независимости наблюдений (повторные измерения)? Например.... У меня есть данные из 5 кампаний прямой почтовой рассылки (проводившихся в течение года) с различными...

19
Повышение: почему скорость обучения называется параметром регуляризации?

Параметр скорости обучения ( ) в Gradient Boosting сокращает вклад каждой новой базовой модели - обычно мелкого дерева - который добавляется в серию. Было показано, что резко повышается точность набора тестов, что понятно, так как при меньших шагах минимум функции потерь может быть достигнут более...

18
Определение функции подбора кривой наилучшего соответствия из линейных, экспоненциальных и логарифмических функций

Контекст: Из вопроса об обмене стеками по математике (могу ли я построить программу) кто-то имеет набор точек и хочет подогнать к нему кривую, линейную, экспоненциальную или логарифмическую. Обычный метод состоит в том, чтобы начать с выбора одного из них (который определяет модель), а затем...

18
Получение формулы для пределов прогнозирования в линейной модели (т. Е. Интервалы прогнозирования)

Давайте возьмем следующий пример: set.seed(342) x1 <- runif(100) x2 <- runif(100) y <- x1+x2 + 2*x1*x2 + rnorm(100) fit <- lm(y~x1*x2) Это создает модель y на основе x1 и x2, используя регрессию OLS. Если мы хотим предсказать y для данного x_vec, мы можем просто использовать формулу,...

17
Модель выживания для прогнозирования оттока - изменяющиеся во времени предикторы?

Я рассчитываю построить прогностическую модель для прогнозирования оттока и использовать модель выживания с дискретным временем, адаптированную к набору данных за период человека (одна строка для каждого клиента и дискретный период, в котором они находились под угрозой, с показателем для события -...

17
Как интерпретировать вывод предиката .coxph?

После подбора кокс-модели можно делать прогнозы и получать относительный риск новых данных. Что я не понимаю, так это то, как относительный риск рассчитывается для человека и к чему он относится (то есть для среднего населения)? Любые рекомендации по ресурсам, которые помогут понять (я не очень...

17
Надежные методы действительно лучше?

У меня есть две группы субъектов, A и B, каждая из которых имеет размер около 400 и около 300 предикторов. Моя цель - построить модель прогнозирования для бинарной переменной ответа. Мой клиент хочет увидеть результат применения модели, построенной из A на B. (В своей книге «Стратегии...

17
Stepwise AIC - Существуют ли противоречия вокруг этой темы?

Я читал бесчисленные посты на этом сайте, которые невероятно против использования пошагового выбора переменных, используя любой критерий, будь то на основе p-значений, AIC, BIC и т. Д. Я понимаю, почему эти процедуры в целом достаточно плохи для выбора переменных. вероятно, знаменитый пост Ганга...

16
Самая быстрая реализация SVM

Больше общего вопроса. Я использую rbf SVM для прогнозного моделирования. Я думаю, что моя текущая программа определенно нуждается в ускорении. Я использую Scikit Learn с грубым, чтобы точный поиск сетки + перекрестная проверка. Каждый запуск SVM занимает около минуты, но со всеми итерациями я все...

16
О Джордже Боксе, Галите Шмуэли и научном методе?

(Этот вопрос может показаться, что он лучше подходит для Philosophy SE. Я надеюсь, что статистики смогут уточнить мои неправильные представления о высказываниях Бокса и Шмуэли, поэтому я публикую его здесь). Джордж Бокс (из известности ARIMA) сказал: «Все модели ошибочны, но некоторые полезны»....

15
Как сделать перекрестную проверку с помощью модели пропорциональных рисков Кокса?

Предположим, что я построил модель прогнозирования возникновения конкретной болезни в одном наборе данных (набор данных построения модели) и теперь хочу проверить, насколько хорошо модель работает в новом наборе данных (набор данных проверки). Для модели, построенной с логистической регрессией, я...

15
Является ли это мошенничеством, чтобы отбросить выбросы, основанные на диаграмме средней абсолютной ошибки, чтобы улучшить регрессионную модель

У меня есть модель прогнозирования, протестированная четырьмя методами, как вы можете видеть на рисунке ниже. Атрибут, который предсказывает модель, находится в диапазоне 0-8. Вы можете заметить, что во всех методах указаны один выброс верхней границы и три выброса нижней границы . Интересно,...

15
Минимизация смещения в объяснительном моделировании, почему? (Галита Шмуэли «Объяснять или предсказывать»)

Этот вопрос ссылается на статью Галита Шмуэли «Объяснить или предсказать» . В частности, в разделе 1.5 «Объяснения и предсказания различны» профессор Шмуэли пишет: При объяснительном моделировании основное внимание уделяется минимизации смещения для получения наиболее точного представления основной...

15
Почему это предсказание временного ряда «довольно плохое»?

Я пытаюсь научиться использовать нейронные сети. Я читал этот урок . После подбора нейронной сети по временному ряду, используя значение в для прогнозирования значения в момент времени t + 1, автор получает следующий график, где синяя линия - это временной ряд, зеленый - это прогноз данных поезда,...

14
Прогнозирующие модели: статистика не может превзойти машинное обучение? [закрыто]

Закрыто . Этот вопрос должен быть более сфокусированным . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он был сосредоточен только на одной проблеме, отредактировав этот пост . Закрыто 2 года назад . В настоящее время я слежу за магистерской...

14
Модель производительности в квантовом моделировании

Я использую квантильную регрессию (например, через gbmили quantregв R) - фокусируюсь не на медиане, а на верхнем квантиле (например, 75-й). Исходя из опыта прогнозного моделирования, я хочу измерить, насколько хорошо модель вписывается в набор тестов, и иметь возможность описать это для...

14
Карет глмнет против cv.glmnet

Кажется, существует большая путаница при сравнении использования glmnetвнутри caretдля поиска оптимальной лямбды и использования cv.glmnetдля выполнения той же задачи. Было задано много вопросов, например: Модель классификации train.glmnet против cv.glmnet? Как правильно использовать glmnet с...

14
Прогнозирующая эффективность зависит больше от опыта аналитика данных, чем от метода?

Я сталкивался со слухами о том, что некоторые исследования показали, что эффективность прогностических моделей больше зависит от опыта аналитика данных с выбранным методом, чем от выбора метода. Другими словами, утверждается, что более важно, чтобы аналитик данных был знаком с выбранным методом,...

14
Может ли метод случайного леса применяться к линейным регрессиям?

Случайные леса работают путем создания множества деревьев решений, где каждое дерево создается с использованием начальной загрузки исходных обучающих данных (выборка как входных переменных, так и наблюдений). Можно ли применить аналогичный процесс для линейной регрессии? Создайте k моделей линейной...