Вопросы с тегом «r»

16
Отображение пространственной и временной корреляции на картах

У меня есть данные для сети метеостанций по всей территории Соединенных Штатов. Это дает мне фрейм данных, который содержит дату, широту, долготу и некоторое измеренное значение. Предположим, что данные собираются один раз в день и определяются погодой регионального масштаба (нет, мы не будем...

16
Как выбрать приоритет в оценке байесовских параметров

Я знаю 3 метода оценки параметров, ML, MAP и байесовский подход. А для MAP и байесовского подхода нам нужно выбирать априоры для параметров, верно? Скажем, у меня есть эта модель , в которой α , β являются параметрами, чтобы выполнить оценку с использованием MAP или байесовского алгоритма, я...

16
Значение предупреждения о сходимости в glmer

Я использую glmerфункцию из lme4пакета в R, и я использую bobyqaоптимизатор (т.е. по умолчанию в моем случае). Я получаю предупреждение, и мне любопытно, что это значит. Warning message: In optwrap(optimizer, devfun, start, rho$lower, control = control, : convergence code 3 from bobyqa: bobyqa -- a...

16
Площадь под кривой ROC или область под кривой PR для несбалансированных данных?

У меня есть некоторые сомнения по поводу того, какую меру эффективности использовать: область под кривой ROC (TPR как функция FPR) или область под кривой точности-отзыва (точность как функция отзыва). Мои данные несбалансированы, то есть количество отрицательных экземпляров намного больше, чем...

16
Многовариантные временные ряды в R. Как найти лаговую корреляцию и построить модель для прогнозирования

Я новичок в этой странице и довольно новый в статистике и Р. Я работаю над проектом для колледжа с целью найти корреляцию между дождем и уровнем воды в реках. Как только корреляция доказана, я хочу прогнозировать / предсказывать это. Данные У меня есть набор данных за несколько лет (взятых каждые 5...

16
Почему нужно использовать REML (вместо ML) для выбора среди вложенных моделей var-covar?

Различные описания по выбору модели на случайные эффекты линейных смешанных моделей инструктируют использовать REML. Я знаю разницу между REML и ML на некотором уровне, но я не понимаю, почему REML следует использовать, потому что ML смещен. Например, неправильно ли проводить LRT для параметра...

16
Оценить коэффициенты ARMA путем проверки ACF и PACF

Как вы оцениваете подходящую модель прогноза для временного ряда путем визуального осмотра графиков ACF и PACF? Какой из них (например, ACF или PACF) сообщает AR или MA (или они оба)? Какая часть графиков показывает вам сезонную и несезонную часть для сезонной ARIMA? Рассмотрим функции ACF и PCF,...

16
Какой алгоритм реализует ward.D в hclust (), если он не является критерием Ward?

Тот, который используется опцией «ward.D» (эквивалентно единственной опции «Ward» в версиях R <= 3.0.3), не реализует критерий кластеризации Ward (1963), тогда как опция «ward.D2» реализует этот критерий ( Муртах и ​​Лежандр 2014). (...

16
Для каких распределений существует объективная оценка в закрытой форме для стандартного отклонения?

Для нормального распределения существует объективная оценка стандартного отклонения, определяемая как: σ^unbiased=Γ(n−12)Γ(n2)12∑k=1n(xi−x¯)2−−−−−−−−−−−−√σ^unbiased=Γ(n−12)Γ(n2)12∑k=1n(xi−x¯)2\hat{\sigma}_\text{unbiased} = \frac{\Gamma(\frac{n-1}{2})}{\Gamma(\frac{n}{2})}...

16
ETS () функция, как избежать прогноза не в соответствии с историческими данными?

Я работаю над алгоритмом в R для автоматизации расчета ежемесячного прогноза. Я использую, среди прочего, функцию ets () из пакета прогноза для расчета прогноза. Это работает очень хорошо. К сожалению, для какого-то определенного временного ряда результат, который я получаю, странный. Пожалуйста,...

16
Зачем нам нужна самозагрузка?

В настоящее время я читаю «Все статистические данные» Ларри Вассермана и озадачен тем, что он написал в главе об оценке статистических функций непараметрических моделей. Он написал «Иногда мы можем найти оценочную стандартную ошибку статистической функции, выполнив некоторые вычисления. Однако в...

16
R пакет для взвешенного случайного леса? вариант classwt?

Я пытаюсь использовать Случайный Лес, чтобы предсказать исход крайне несбалансированного набора данных (уровень меньшинства составляет около 1% или даже меньше). Поскольку традиционный алгоритм случайного леса минимизирует общую частоту ошибок, вместо того, чтобы уделять особое внимание классам...

16
Зачем преобразовывать данные в журнал перед выполнением анализа главных компонентов?

Я следую учебному пособию здесь: http://www.r-bloggers.com/computing-and-visualizing-pca-in-r/, чтобы лучше понять PCA. Учебное пособие использует набор данных Iris и применяет преобразование журнала до PCA: Обратите внимание, что в следующем коде мы применяем логарифмическое преобразование к...

16
Как сделать прогнозирование с обнаружением выбросов в R? - Процедура и метод анализа временных рядов

У меня есть месячные данные временных рядов, и я хотел бы сделать прогноз с обнаружением выбросов. Это образец моего набора данных: Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 2006 7.55 7.63 7.62 7.50 7.47 7.53 7.55 7.47 7.65 7.72 7.78 7.81 2007 7.71 7.67 7.85 7.82 7.91 7.91 8.00 7.82 7.90 7.93...

16
В множественной линейной регрессии, почему график предсказанных точек не лежит на прямой линии?

Я использую множественную линейную регрессию для описания отношений между Y и X1, X2. Из теории я понял, что множественная регрессия предполагает линейные отношения между Y и каждым из X (Y и X1, Y и X2). Я не использую какие-либо преобразования X. Итак, я получил модель с R = 0,45 и всем значимым...

16
Разница остаточных стандартных ошибок между optim и glm

Я пытаюсь воспроизвести optimрезультаты простой линейной регрессии, снабженной glmили даже nlsR-функциями. Оценки параметров одинаковы, но оценка остаточной дисперсии и стандартные ошибки других параметров не одинаковы, особенно при небольшом размере выборки. Я полагаю, что это из-за различий в...

16
Каким образом прогнозируемые вероятности класса `gnett.randomForest` оценивают?

Как randomForestпакет оценивает вероятности класса, когда я использую predict(model, data, type = "prob")? Я использовал rangerдля обучения случайных лесов, используя probability = Tаргумент для прогнозирования вероятностей. rangerв документации сказано что это: Вырастите лес вероятности, как в...

16
Тензоры в литературе по нейронным сетям: какое самое простое определение?

В литературе по нейронным сетям часто встречается слово «тензор». Это отличается от вектора? А из матрицы? У вас есть конкретный пример, который разъясняет его определение? Я немного запутался в его определении. Википедия не помогает, и иногда у меня складывается впечатление, что ее определение...

16
Как использовать порядковую логистическую регрессию со случайными эффектами?

В моем исследовании я буду измерять рабочую нагрузку с помощью нескольких показателей. С вариабельностью сердечного ритма (ВСР), электродермальной активностью (ЭДА) и с субъективной шкалой (СРП). После нормализации IWS имеет три значения: Рабочая нагрузка ниже нормальной Рабочая нагрузка средняя...

16
Происхождение обозначений в стиле Уилкинсона, таких как (1 | id) для случайных эффектов в формулах смешанных моделей в R

Модельные формулы в R, такие как y ~ x + a*b + c:d основаны на так называемой записи Уилкинсона : Уилкинсон и Роджерс 1973, Символическое описание факторных моделей для анализа отклонений . В этой статье не обсуждались нотации для смешанных моделей (которых тогда не могло быть). Так, где же...