Вопросы с тегом «r»

16

Отображение пространственной и временной корреляции на картах

У меня есть данные для сети метеостанций по всей территории Соединенных Штатов. Это дает мне фрейм данных, который содержит дату, широту, долготу и некоторое измеренное значение. Предположим, что данные собираются один раз в день и определяются погодой регионального масштаба (нет, мы не будем...

16

Как выбрать приоритет в оценке байесовских параметров

Я знаю 3 метода оценки параметров, ML, MAP и байесовский подход. А для MAP и байесовского подхода нам нужно выбирать априоры для параметров, верно? Скажем, у меня есть эта модель , в которой α , β являются параметрами, чтобы выполнить оценку с использованием MAP или байесовского алгоритма, я...

bayesian estimation prior

16

Значение предупреждения о сходимости в glmer

Я использую glmerфункцию из lme4пакета в R, и я использую bobyqaоптимизатор (т.е. по умолчанию в моем случае). Я получаю предупреждение, и мне любопытно, что это значит. Warning message: In optwrap(optimizer, devfun, start, rho$lower, control = control, : convergence code 3 from bobyqa: bobyqa -- a...

r optimization lme4-nlme convergence glmm

16

Площадь под кривой ROC или область под кривой PR для несбалансированных данных?

У меня есть некоторые сомнения по поводу того, какую меру эффективности использовать: область под кривой ROC (TPR как функция FPR) или область под кривой точности-отзыва (точность как функция отзыва). Мои данные несбалансированы, то есть количество отрицательных экземпляров намного больше, чем...

r machine-learning roc precision-recall auc

16

Многовариантные временные ряды в R. Как найти лаговую корреляцию и построить модель для прогнозирования

Я новичок в этой странице и довольно новый в статистике и Р. Я работаю над проектом для колледжа с целью найти корреляцию между дождем и уровнем воды в реках. Как только корреляция доказана, я хочу прогнозировать / предсказывать это. Данные У меня есть набор данных за несколько лет (взятых каждые 5...

r time-series forecasting cross-correlation lags

16

Почему нужно использовать REML (вместо ML) для выбора среди вложенных моделей var-covar?

Различные описания по выбору модели на случайные эффекты линейных смешанных моделей инструктируют использовать REML. Я знаю разницу между REML и ML на некотором уровне, но я не понимаю, почему REML следует использовать, потому что ML смещен. Например, неправильно ли проводить LRT для параметра...

mixed-model maximum-likelihood unbiased-estimator likelihood-ratio reml

16

Оценить коэффициенты ARMA путем проверки ACF и PACF

Как вы оцениваете подходящую модель прогноза для временного ряда путем визуального осмотра графиков ACF и PACF? Какой из них (например, ACF или PACF) сообщает AR или MA (или они оба)? Какая часть графиков показывает вам сезонную и несезонную часть для сезонной ARIMA? Рассмотрим функции ACF и PCF,...

r time-series forecasting acf-pacf

16

Какой алгоритм реализует ward.D в hclust (), если он не является критерием Ward?

Тот, который используется опцией «ward.D» (эквивалентно единственной опции «Ward» в версиях R <= 3.0.3), не реализует критерий кластеризации Ward (1963), тогда как опция «ward.D2» реализует этот критерий ( Муртах и Лежандр 2014). (...

r clustering ward

16

Для каких распределений существует объективная оценка в закрытой форме для стандартного отклонения?

Для нормального распределения существует объективная оценка стандартного отклонения, определяемая как: σ^unbiased=Γ(n−12)Γ(n2)12∑k=1n(xi−x¯)2−−−−−−−−−−−−√σ^unbiased=Γ(n−12)Γ(n2)12∑k=1n(xi−x¯)2\hat{\sigma}_\text{unbiased} = \frac{\Gamma(\frac{n-1}{2})}{\Gamma(\frac{n}{2})}...

mathematical-statistics standard-deviation unbiased-estimator

16

ETS () функция, как избежать прогноза не в соответствии с историческими данными?

Я работаю над алгоритмом в R для автоматизации расчета ежемесячного прогноза. Я использую, среди прочего, функцию ets () из пакета прогноза для расчета прогноза. Это работает очень хорошо. К сожалению, для какого-то определенного временного ряда результат, который я получаю, странный. Пожалуйста,...

r time-series forecasting exponential-smoothing

16

Зачем нам нужна самозагрузка?

В настоящее время я читаю «Все статистические данные» Ларри Вассермана и озадачен тем, что он написал в главе об оценке статистических функций непараметрических моделей. Он написал «Иногда мы можем найти оценочную стандартную ошибку статистической функции, выполнив некоторые вычисления. Однако в...

self-study estimation bootstrap standard-error

16

R пакет для взвешенного случайного леса? вариант classwt?

Я пытаюсь использовать Случайный Лес, чтобы предсказать исход крайне несбалансированного набора данных (уровень меньшинства составляет около 1% или даже меньше). Поскольку традиционный алгоритм случайного леса минимизирует общую частоту ошибок, вместо того, чтобы уделять особое внимание классам...

r random-forest

16

Зачем преобразовывать данные в журнал перед выполнением анализа главных компонентов?

Я следую учебному пособию здесь: http://www.r-bloggers.com/computing-and-visualizing-pca-in-r/, чтобы лучше понять PCA. Учебное пособие использует набор данных Iris и применяет преобразование журнала до PCA: Обратите внимание, что в следующем коде мы применяем логарифмическое преобразование к...

r pca data-transformation logarithm

16

Как сделать прогнозирование с обнаружением выбросов в R? - Процедура и метод анализа временных рядов

У меня есть месячные данные временных рядов, и я хотел бы сделать прогноз с обнаружением выбросов. Это образец моего набора данных: Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 2006 7.55 7.63 7.62 7.50 7.47 7.53 7.55 7.47 7.65 7.72 7.78 7.81 2007 7.71 7.67 7.85 7.82 7.91 7.91 8.00 7.82 7.90 7.93...

r time-series forecasting arima outliers

16

В множественной линейной регрессии, почему график предсказанных точек не лежит на прямой линии?

Я использую множественную линейную регрессию для описания отношений между Y и X1, X2. Из теории я понял, что множественная регрессия предполагает линейные отношения между Y и каждым из X (Y и X1, Y и X2). Я не использую какие-либо преобразования X. Итак, я получил модель с R = 0,45 и всем значимым...

regression multiple-regression python linear

16

Разница остаточных стандартных ошибок между optim и glm

Я пытаюсь воспроизвести optimрезультаты простой линейной регрессии, снабженной glmили даже nlsR-функциями. Оценки параметров одинаковы, но оценка остаточной дисперсии и стандартные ошибки других параметров не одинаковы, особенно при небольшом размере выборки. Я полагаю, что это из-за различий в...

r maximum-likelihood optimization

16

Каким образом прогнозируемые вероятности класса `gnett.randomForest` оценивают?

Как randomForestпакет оценивает вероятности класса, когда я использую predict(model, data, type = "prob")? Я использовал rangerдля обучения случайных лесов, используя probability = Tаргумент для прогнозирования вероятностей. rangerв документации сказано что это: Вырастите лес вероятности, как в...

r random-forest prediction

16

Тензоры в литературе по нейронным сетям: какое самое простое определение?

В литературе по нейронным сетям часто встречается слово «тензор». Это отличается от вектора? А из матрицы? У вас есть конкретный пример, который разъясняет его определение? Я немного запутался в его определении. Википедия не помогает, и иногда у меня складывается впечатление, что ее определение...

neural-networks terminology definition tensor

16

Как использовать порядковую логистическую регрессию со случайными эффектами?

В моем исследовании я буду измерять рабочую нагрузку с помощью нескольких показателей. С вариабельностью сердечного ритма (ВСР), электродермальной активностью (ЭДА) и с субъективной шкалой (СРП). После нормализации IWS имеет три значения: Рабочая нагрузка ниже нормальной Рабочая нагрузка средняя...

r logistic lme4-nlme ordered-logit polr

16

Происхождение обозначений в стиле Уилкинсона, таких как (1 | id) для случайных эффектов в формулах смешанных моделей в R

Модельные формулы в R, такие как y ~ x + a*b + c:d основаны на так называемой записи Уилкинсона : Уилкинсон и Роджерс 1973, Символическое описание факторных моделей для анализа отклонений . В этой статье не обсуждались нотации для смешанных моделей (которых тогда не могло быть). Так, где же...

r mixed-model lme4-nlme notation history