Вопросы с тегом «r»

11
R / mgcv: Почему тензорные продукты te () и ti () производят разные поверхности?

mgcvПакет Rимеет две функции для установки взаимодействия Тензор продукта: te()и ti(). Я понимаю основное разделение труда между ними (подгонка нелинейного взаимодействия против разложения этого взаимодействия на основные эффекты и взаимодействие). Чего я не понимаю, так это почему te(x1, x2)и...

11
Выбор модели Mclust

Пакет R mclustиспользует BIC в качестве критерия выбора модели кластера. Насколько я понимаю, модель с самым низким BIC следует выбирать среди других моделей (если вы заботитесь только о BIC). Однако, когда значения BIC все отрицательные, по Mclustумолчанию используется модель с самым высоким...

11
Каковы преимущества экспоненциального генератора случайных чисел, использующего метод Аренса и Дитера (1972), а не обратным преобразованием?

Мой вопрос вдохновлен встроенным экспоненциальным генератором случайных чисел R , функцией rexp(). При попытке генерировать экспоненциально распределенные случайные числа многие учебники рекомендуют метод обратного преобразования, описанный на этой странице Википедии . Я знаю, что есть другие...

11
Понимание Gelman & Carlin «За пределами расчета мощности:…» (2014)

Я читаю Gelman & Carlin «Помимо вычислений мощности: оценка ошибок типа S (знак) и типа M (величина)» (2014). Я пытаюсь понять основную идею, основной путь, но я в замешательстве. Может ли кто-нибудь помочь мне понять сущность? Бумага идет примерно так (если я правильно понял). Статистические...

11
Надежность подобранной кривой?

Я хотел бы оценить неопределенность или надежность подобранной кривой. Я намеренно не называю точную математическую величину, которую ищу, потому что не знаю, что это. Здесь (энергия) является зависимой переменной (отклик), а V (объем) является независимой переменной. Я хотел бы найти кривую...

11
Пространственное представление состояний ARMA (p, q) из Гамильтона

Я читал главу 13 Гамильтона, и у него есть следующее представление пространства состояний для ARMA (p, q). Пусть Затем процесс ARMA (p, q) выглядит следующим образом: \ begin {align} y_t - \ mu & = \ phi_1 (y_ {t-1} - \ mu) + \ phi_2 (y_ {t-2} - \ mu) + ... + \ phi_3 (y_ {t-3} - \ mu) \\ &...

11
Байесовский шип и плита против наказанных методов

Я читаю слайды Стивена Скотта о пакете BSTS R (Вы можете найти их здесь: слайды ). В какой-то момент, говоря о включении многих регрессоров в модель структурных временных рядов, он вводит априорные и контрольные значения коэффициентов регрессии и говорит, что они лучше по сравнению с штрафными...

11
Когда использовать модель со смешанным эффектом?

Модели линейных смешанных эффектов - это расширения моделей линейной регрессии для данных, которые собираются и обобщаются в группы. Ключевым преимуществом является то, что коэффициенты могут варьироваться по отношению к одной или нескольким групповым переменным. Тем не менее, я борюсь с тем, когда...

11
Стрелки базовых переменных в биплоте PCA в R

Рискуя сделать вопрос специфичным для программного обеспечения и из-за его повсеместности и особенностей, я хочу спросить о функции biplot()в R и, более конкретно, о вычислении и построении по умолчанию ее наложенных красных стрелок, соответствующих к базовым переменным. [Чтобы разобраться в...

11
RandomForest и веса классов

Вопрос в одном предложении: знает ли кто-нибудь, как определить вес хорошего класса для случайного леса? Пояснение: я играю с несбалансированными наборами данных. Я хочу использовать этот Rпакет randomForest, чтобы обучить модель очень искаженному набору данных, используя только небольшие...

11
Почему в фильтре Калмана вероятность вычисляется с использованием результатов фильтра, а не сглаженных результатов?

Я использую фильтр Калмана очень стандартным способом. Система представлена ​​уравнением состояния xt+1=Fxt+vt+1xt+1=Fxt+vt+1x_{t+1}=Fx_{t}+v_{t+1} и уравнением наблюдения yt=Hxt+Azt+wtyt=Hxt+Azt+wty_{t}=Hx_{t}+Az_{t}+w_{t} . Учебники учат , что после применения фильтра Калмана и получать «прогнозы...

11
Является ли коэффициент ошибок выпуклой функцией лямбда-параметра регуляризации?

При выборе параметра регуляризации лямбда в Ridge или Lasso рекомендуется использовать разные значения лямбды, измерить ошибку в наборе валидации и, наконец, выбрать то значение лямбды, которое возвращает наименьшую ошибку. Мне не понятно, если функция f (лямбда) = error является выпуклой. Может ли...

11
Почему LKJcorr является хорошим приоритетом для корреляционной матрицы?

Я читаю главу 13 «Приключения в ковариации» в ( превосходной ) книге Ричарда Мак-Элирея « Статистическое переосмысление », где он представляет следующую иерархическую модель: ( Rэто корреляционная матрица) Автор объясняет, что LKJcorrэто слабоинформативный априор, который работает как...

11
Почему методы регрессии методом наименьших квадратов и максимального правдоподобия не эквивалентны, когда ошибки обычно не распределяются?

Название говорит обо всем. Я понимаю, что наименьшие квадраты и максимальное правдоподобие дадут одинаковый результат для коэффициентов регрессии, если ошибки модели будут нормально распределены. Но что произойдет, если ошибки не распределяются нормально? Почему два метода больше не...

11
Как рассчитать доверительные оценки в регрессии (со случайными лесами / XGBoost) для каждого прогноза в R?

Есть ли способ получить показатель достоверности (мы можем также назвать его значением достоверности или вероятности) для каждого прогнозируемого значения при использовании таких алгоритмов, как Random Forests или Extreme Gradient Boosting (XGBoost)? Допустим, этот показатель доверия будет...

11
Интерпретация производной Радона-Никодима между вероятностными мерами?

Я видел в некоторых моментах использование производной Радона-Никодима одной вероятностной меры по отношению к другой, особенно в дивергенции Кульбака-Лейблера, где она является производной вероятностной меры модели для некоторого произвольного параметра с относительно реального параметра θ 0...

11
Почему существуют рекомендации против использования Jeffreys или энтропийных априоров для сэмплеров MCMC?

На своей вики-странице разработчики Стэна заявляют: Некоторые принципы нам не нравятся: инвариантность, Джеффрис, энтропия Вместо этого я вижу много нормальных рекомендаций по распространению. До сих пор я использовал байесовские методы, которые не основывались на выборке, и был отчасти рад, что...

11
Байесовский оценщик невосприимчив к смещению отбора

Являются ли оценки Байеса невосприимчивыми к смещению отбора? В большинстве работ, в которых обсуждаются оценки в высоком измерении, например, данные о последовательности всего генома, часто возникает проблема смещения отбора. Смещение выбора обусловлено тем фактом, что, хотя у нас есть тысячи...

11
Разве несколько фильтров в сверточном слое не будут учить один и тот же параметр во время тренировки?

Основываясь на том, что я узнал, мы используем несколько фильтров в Conv Layer CNN для изучения различных детекторов функций. Но так как эти фильтры применяются одинаково (то есть скользят и умножаются на области ввода), разве они не изучат одни и те же параметры во время обучения? Следовательно,...