Вопросы с тегом «prediction»

15
Может ли модель для неотрицательных данных со сгущением в нули (Tweedie GLM, нулевое раздувание GLM и т. Д.) Предсказать точные нули?

Распределение Твиди может моделировать искаженные данные с точечной массой в нуле, когда параметр (показатель степени в отношении средней дисперсии) находится между 1 и 2.pпp Точно так же модель с нулевой раздувкой (будь то непрерывная или дискретная) может иметь большое количество нулей. У меня...

15
Какова интуиция за сменными образцами при нулевой гипотезе?

Тесты перестановки (также называемые тестом рандомизации, тестом повторной рандомизации или точным тестом) очень полезны и оказываются полезными, когда предположение о нормальном распределении, требуемое, например, t-testне выполняется, и когда преобразование значений путем ранжирования...

15
Почему это предсказание временного ряда «довольно плохое»?

Я пытаюсь научиться использовать нейронные сети. Я читал этот урок . После подбора нейронной сети по временному ряду, используя значение в для прогнозирования значения в момент времени t + 1, автор получает следующий график, где синяя линия - это временной ряд, зеленый - это прогноз данных поезда,...

14
Такая вещь, как взвешенная корреляция?

У меня есть некоторые интересные данные о самых популярных музыкальных артистах, разделенных по местоположению на 200 избирательных округов. Я хочу посмотреть, возможно ли опросить человека по его или ее музыкальным предпочтениям и определить, «слушает ли он как демократ» или «слушает ли как...

14
Как получить прогнозы с точки зрения времени выживания из модели Кокса PH?

Я хочу разработать модель прогнозирования (Кокс-РН) для смертности от всех причин в наборе данных участников, из которых (почти) все умерли в конце периода наблюдения (например, 1 год). Вместо того, чтобы прогнозировать абсолютный риск смерти в определенный момент времени, я хотел бы предсказать...

14
Как предсказать один временной ряд из другого временного ряда, если они связаны

Я пытался решить эту проблему больше года без особого прогресса. Это часть исследовательского проекта, которым я занимаюсь, но я проиллюстрирую его на примере истории, которую я составил, потому что реальная область проблемы немного сбивает с толку (отслеживание глаз). Вы - самолет, следящий за...

14
Прогнозирующие модели: статистика не может превзойти машинное обучение? [закрыто]

Закрыто . Этот вопрос должен быть более сфокусированным . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он был сосредоточен только на одной проблеме, отредактировав этот пост . Закрыто 2 года назад . В настоящее время я слежу за магистерской...

14
Карет глмнет против cv.glmnet

Кажется, существует большая путаница при сравнении использования glmnetвнутри caretдля поиска оптимальной лямбды и использования cv.glmnetдля выполнения той же задачи. Было задано много вопросов, например: Модель классификации train.glmnet против cv.glmnet? Как правильно использовать glmnet с...

13
Как масштабировать новые наблюдения для прогнозирования, когда модель снабжена масштабированными данными?

Я понимаю концепцию масштабирования матрицы данных для использования в модели линейной регрессии. Например, в R вы можете использовать: scaled.data <- scale(data, scale=TRUE) Мой единственный вопрос: для новых наблюдений, для которых я хочу предсказать выходные значения, как они правильно...

13
Случайный лес и прогноз

Я пытаюсь понять, как работает Random Forest. У меня есть представление о том, как строятся деревья, но я не могу понять, как Random Forest делает прогнозы на выборке из сумки. Может ли кто-нибудь дать мне простое объяснение, пожалуйста?...

13
используя информацию о соседях при вменении данных или находке вне данных (в R)

У меня есть набор данных с предположением, что ближайшие соседи являются лучшими предикторами. Просто прекрасный пример визуализации двухстороннего градиента Предположим, у нас есть случай, когда несколько значений отсутствуют, мы можем легко предсказать на основе соседей и тренда. Соответствующая...

13
Прогнозирование на моделях со смешанным эффектом: что делать со случайными эффектами?

Давайте рассмотрим этот гипотетический набор данных: set.seed(12345) num.subjects <- 10 dose <- rep(c(1,10,50,100), num.subjects) subject <- rep(1:num.subjects, each=4) group <- rep(1:2, each=num.subjects/2*4) response <- dose*dose/10 * group + rnorm(length(dose), 50, 30) df <-...

12
Требуется ли предварительная обработка перед прогнозированием с использованием FinalModel из RandomForest с пакетом Caret?

Я использую пакет caret для обучения объекта randomForest с 10x10CV. library(caret) tc <- trainControl("repeatedcv", number=10, repeats=10, classProbs=TRUE, savePred=T) RFFit <- train(Defect ~., data=trainingSet, method="rf", trControl=tc, preProc=c("center", "scale")) После этого я тестирую...

12
Точный критерий Фишера и гипергеометрическое распределение

Я хотел лучше понять точный критерий Фишера, поэтому я разработал следующий пример игрушки, где f и m соответствуют мужской и женской части, а n и y соответствуют «потреблению соды», например: > soda_gender f m n 0 5 y 5 0 Очевидно, это резкое упрощение, но я не хотел, чтобы контекст мешал....

12
Прогнозирование данных счета со случайным лесом

Можно ли обучить Случайный Лес для правильного прогнозирования данных счета? Как это будет продолжаться? У меня довольно широкий диапазон значений, поэтому классификация не имеет смысла. Если бы я использовал регрессию, я бы просто усек результат? Я совершенно потерян здесь. Есть...

11
Интервалы прогнозирования и толерантности

У меня есть пара вопросов для прогнозирования и интервалов терпимости. Давайте сначала договоримся об определении интервалов толерантности: нам дают уровень достоверности, скажем, 90%, процент населения, подлежащего отбору, скажем, 99%, и размер выборки, скажем, 20. Распределение вероятностей...

11
Выбор модели ABC

Было показано, что выбор модели ABC с использованием байесовских факторов не рекомендуется из-за наличия ошибки, связанной с использованием сводной статистики. Заключение в этой статье основано на изучении поведения популярного метода аппроксимации байесовского фактора (алгоритм 2). Хорошо...

11
Как рассчитать доверительные оценки в регрессии (со случайными лесами / XGBoost) для каждого прогноза в R?

Есть ли способ получить показатель достоверности (мы можем также назвать его значением достоверности или вероятности) для каждого прогнозируемого значения при использовании таких алгоритмов, как Random Forests или Extreme Gradient Boosting (XGBoost)? Допустим, этот показатель доверия будет...

11
R / mgcv: Почему тензорные продукты te () и ti () производят разные поверхности?

mgcvПакет Rимеет две функции для установки взаимодействия Тензор продукта: te()и ti(). Я понимаю основное разделение труда между ними (подгонка нелинейного взаимодействия против разложения этого взаимодействия на основные эффекты и взаимодействие). Чего я не понимаю, так это почему te(x1, x2)и...

11
Интервал прогнозирования = вероятный интервал?

Мне интересно, если интервал прогнозирования и вероятный интервал оценивают одно и то же. Например, при линейной регрессии, когда вы оцениваете интервал прогнозирования подобранных значений, вы оцениваете пределов интервала, в котором вы ожидаете, что ваше значение упадет. В противоположность...