Вопросы с тегом «r»

11
Почему бы нам просто не изучить гиперпараметры?

Я реализовывал довольно популярную статью « ОБЪЯСНЕНИЕ И ПРИМЕНЕНИЕ ОБОБЩЕННЫХ ПРИМЕРОВ », и в статье она обучает противоборствующей целевой функции. J '' (θ) = αJ (θ) + (1 - α) J '(θ). Он рассматривает α как гиперпараметр. α может быть 0,1, 0,2, 0,3 и т. д. Независимо от этой конкретной статьи,...

11
Может ли надлежащая априорная и возведенная в степень вероятность привести к неправильной апостериорной?

(Этот вопрос навеян этот комментарий от Сианя .) Хорошо известно, что если предварительное распределение π(θ)π(θ)\pi(\theta) является правильным и вероятность L(θ|x)L(θ|x)L(\theta | x) хорошо определена, то апостериорное распределение π(θ|x)∝π(θ)L(θ|x)π(θ|x)∝π(θ)L(θ|x)\pi(\theta|x)\propto...

11
Значит ли центрирование уменьшать ковариацию?

Предполагая, что у меня есть две независимые случайные величины, и я хочу максимально уменьшить ковариацию между ними, не теряя слишком много «сигнала», поможет ли центрирование? Я где-то читал, что среднее значение центрирования уменьшает корреляцию значительным фактором, поэтому я думаю, что для...

11
Существуют ли «эзотерические» статистические тесты с очень низкой мощностью?

Фон В информатике, математике, а иногда и в других областях «эзотерические» примеры могут быть не только занимательными, но и полезными для иллюстрации некоторых понятий, например: Bogosort и Slowsort являются очень неэффективными алгоритмами сортировки, которые можно использовать для понимания...

10
Можно ли напрямую читать столбцы CSV как категориальные данные?

Мне нужно проанализировать с помощью R данные медицинского обследования (с более 100 кодированными столбцами), которое приходит в CSV. Я буду использовать погремушку для некоторого начального анализа, но за кадром это все еще R. Если я читаю файл .csv () , столбцы с числовыми кодами рассматриваются...

10
Вывод логистической модели в R

Я пытаюсь интерпретировать следующий тип логистической модели: mdl <- glm(c(suc,fail) ~ fac1 + fac2, data=df, family=binomial) Является ли вывод predict(mdl)ожидаемых шансов на успех для каждой точки данных? Есть ли простой способ табулировать шансы для каждого факторного уровня модели, а не для...

10
Когда использовать (не) параметрический критерий предположения о гомоскедастичности?

Если проверяется предположение о гомоскедастичности, то доступны параметрический (критерий Бартлетта однородности отклонений bartlett.test) и непараметрический (критерий Фигнера-Киллина однородности отклонений fligner.test). Как сказать, какой использовать? Должно ли это зависеть, например, от...

10
Омега в квадрате для измерения эффекта в R?

Книга статистики, которую я читаю, рекомендует омега в квадрате, чтобы измерить результаты моих экспериментов. Я уже доказал, используя сплит-дизайн (сочетание внутри-предметов и между-предметов), что мои внутри-предметы факторы статистически значимы с р <0,001 и F = 17. Теперь я смотрю,...

10
Как искать долины на графике?

Я изучаю некоторые данные о геномном покрытии, которые в основном представляют собой длинный список (несколько миллионов значений) целых чисел, каждый из которых говорит о том, насколько хорошо (или «глубоко») охвачена эта позиция в геноме. Я хотел бы найти «долины» в этих данных, то есть регионы,...

10
Учитывая цепочку 10D MCMC, как я могу определить ее апостериорные моды в R?

Вопрос: С 10-мерной цепочкой MCMC, скажем, я готов передать вам матрицу розыгрышей: 100 000 итераций (строк) по 10 параметрам (столбцам), как лучше всего определить апостериорные моды? Я особенно обеспокоен несколькими режимами. Фон:Я считаю себя статистически подкованным статистиком, но когда...

10
Перевести R на C ++ (в конце концов с Rcpp) [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто 2 года назад . Я хотел бы научиться использовать Rcpp . Я просмотрел документы на веб-сайте пакета CRAN, но я...

10
В R «glmnet» соответствует перехвату?

Я подгоняю линейную модель в R, используя glmnet. Исходная (не регуляризованная) модель была подогнана с использованием lmи не имела постоянного члена (т.е. она была в форме lm(y~0+x1+x2,data)). glmnetберет матрицу предикторов и вектор ответов. Я читал glmnetдокументацию и не могу найти упоминания...

10
Пакет R для объединения уровней факторов для обработки данных?

Хотите знать, сталкивался ли кто-нибудь с пакетом / функцией в R, которая объединит уровни фактора, доля всех уровней которого меньше некоторого порога? В частности, одним из первых шагов в подготовке данных, которые я выполняю, является объединение разреженных уровней факторов вместе (скажем, в...

10
Построение кусочно-регрессионной линии

Есть ли способ построения линии регрессии кусочной модели, подобной этой, кроме использования linesдля построения каждого сегмента отдельно или использования geom_smooth(aes(group=Ind), method="lm", fill=FALSE)? m.sqft <- mean(sqft) model <- lm(price~sqft+I((sqft-m.sqft)*Ind)) # sqft, price:...

10
Как я могу оценить плотность нулевого параметра в R?

У меня есть набор данных с большим количеством нулей, который выглядит следующим образом: set.seed(1) x <- c(rlnorm(100),rep(0,50)) hist(x,probability=TRUE,breaks = 25) Я хотел бы нарисовать линию для его плотности, но density()функция использует движущееся окно, которое вычисляет отрицательные...

10
Разница между реализацией регрессионного гребня в R и SAS

Я читал описание регрессии гребня в Прикладных линейных статистических моделях , 5-е издание, глава 11. Регрессия гребня выполняется на основе данных о жировых отложениях, доступных здесь . Учебник соответствует выходным данным в SAS, где обратные преобразованные коэффициенты заданы в модели как:...

10
Создание интерфейсов MATLAB и R для C5.0 Росса Куинлана

Я рассматриваю построение интерфейсов MATLAB и R для Ross Куинланом «s C5.0 (для тех , кто не знаком с ним, C5.0 является алгоритм дерева решений и пакет программного обеспечения, расширение C4.5 ), и я пытаюсь получить представление о компонентах, которые мне нужно написать. Единственная...

10
Документированные / воспроизводимые примеры успешного применения эконометрических методов в реальных условиях?

Этот вопрос может показаться очень широким, но вот что я ищу. Я знаю, что есть много прекрасных книг об эконометрических методах и много отличных пояснительных статей об эконометрических методах. Существуют даже превосходные воспроизводимые примеры эконометрики, как описано в этом перекрестном...

10
Использование пакета статистики в R для кластеризации kmeans

Мне трудно понять один или два аспекта кластерного пакета. Я внимательно следую примеру Quick-R , но не понимаю один или два аспекта анализа. Я включил код, который я использую для этого конкретного примера. ## Libraries library(stats) library(fpc) ## Data mydata = structure(list(a = c(461.4210925,...

10
RNG, R, mclapply и кластер компьютеров

Я запускаю симуляцию на R и кластере компьютеров и имею следующую проблему. На каждом из компьютеров X я запускаю: fxT2 <- function(i) runif(10) nessay <- 100 c(mclapply(1:nessay, fxT2), recursive=TRUE) Есть 32 компьютера, каждый с 16 ядрами. Тем не менее, около 2% случайных чисел идентичны....