Вопросы с тегом «r»

12
Манипулирование моделью логистической регрессии

Я хотел бы понять, что делает следующий код. Человек, который написал код, больше не работает здесь, и он почти полностью без документов. Меня попросили исследовать это кто-то, кто думает, что это "модель байесовской логистической регрессии " bglm <- function(Y,X) { # Y is a vector of binary...

12
Динамический факторный анализ и модель пространства состояний

Пакет MARSS в R предлагает функцию для динамического факторного анализа. В этом пакете динамическая факторная модель написана как особая форма модели пространства состояний, и они предполагают, что общие тенденции следуют процессу AR (1). Поскольку я не очень знаком с этими двумя методами, я задаю...

12
Что такое «начальные значения» в функции glm ()?

Какие параметры start, etastart, mustartв GLM () функцию ? Я искал в документах и ​​Интернете, но я не нашел четкого объяснения, что это значит. Это похоже на байесовские «начальные значения» для цепочек, но я сомневаюсь, что это связано, так как функция glm () в R является статистикой частых...

12
Дисперсионно-ковариационная матрица ошибок в линейной регрессии

Как на практике вычисляется матрица ошибок var / cov с помощью пакетов статистического анализа? Эта идея понятна мне в теории. Но не на практике. Я имею в виду, что если у меня есть вектор случайных величин , я понимаю, что матрице дисперсии / ковариации Σ будет дан внешний продукт отклонения от...

12
Интерпретация модели логистической регрессии с несколькими предикторами

Я выполнил многомерную логистическую регрессию с зависимой переменной, Yявляющейся смертью в доме престарелых в течение определенного периода времени, и получил следующие результаты (обратите внимание, что переменные, начинающиеся в Aнем, являются непрерывным значением, а те, которые начинаются в,...

12
Критерии выбора «лучшей» модели в скрытой марковской модели

У меня есть набор данных временного ряда, к которому я пытаюсь подогнать скрытую марковскую модель (HMM), чтобы оценить количество скрытых состояний в данных. Мой псевдокод для этого следующий: for( i in 2 : max_number_of_states ){ ... calculate HMM with i states ... optimal_number_of_states =...

12
Смешанная модель с 1 наблюдением за уровень

Я подгоняю модель случайных эффектов glmerк некоторым бизнес-данным. Цель состоит в том, чтобы проанализировать показатели продаж по дистрибьюторам с учетом региональных различий. У меня есть следующие переменные: distcode: идентификатор дистрибьютора, около 800 уровней region: географический...

12
Лучший способ просто хранить данные для статистического анализа в R [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто 6 лет назад . Я уже некоторое время использую текстовые файлы для хранения своих данных для R без каких-либо...

12
Почему значение Морана I не равно «-1» в идеально распределенной точке

Википедия не так ... или я не понимаю? Википедия: Белые и черные квадраты («шахматный рисунок») отлично рассеяны, поэтому у Морана я буду -1. Если бы белые квадраты были сложены на одной половине доски, а черные - на другой, значение Морана I было бы близко к +1. Случайное расположение квадратных...

12
Прогнозирование часовых временных рядов с ежедневной, еженедельной и годовой периодичностью

Основная редакция: Я хотел бы сказать большое спасибо Дэйву и Нику за их ответы. Хорошая новость заключается в том, что у меня получился цикл (принцип заимствован из поста профессора Гиднмана о пакетном прогнозировании). Чтобы объединить невыполненные запросы: а) Как мне увеличить максимальное...

12
Как преобразовать вывод фитинга lm () с кубическим сплайном в уравнение регрессии

У меня есть код и вывод, и я хотел бы построить модель. Я не знаю, как построить модель, используя этот вывод: require("splines") x <- c(0.2, 0.23, 0.26, 0.29, 0.33, 0.46, 0.53 ) y <- c(0.211, 0.2026, 0.2034, 0.2167, 0.2177, 0.19225, 0.182) fit <- lm(y ~ ns(x,3)) summary(fit) Обратите...

12
Путаница с lmer и p-значениями: как p-значения из пакета memisc сравниваются с MCMC?

У меня сложилось впечатление, что функция lmer()в lme4пакете не производит p-значения (см. lmerP-значения и все такое ). Я использую MCMC сгенерированных значений р вместо как на этот вопрос: Значительный эффект в lme4смешанной модели и на этот вопрос: Не удается найти р-значения в выводе из...

12
Можно ли применить расхождение KL между дискретным и непрерывным распределением?

Я не математик. Я искал в Интернете о KL Divergence. Я узнал, что дивергенция KL измеряет потерянную информацию, когда мы приближаемся к распределению модели относительно входного распределения. Я видел это между любыми двумя непрерывными или дискретными распределениями. Можем ли мы сделать это...

12
В R как вычислить значение p для площади под ROC

Я изо всех сил пытаюсь найти способ вычислить значение p для области под характеристикой оператора приемника (ROC). У меня есть непрерывная переменная и результат диагностического теста. Я хочу посмотреть, является ли AUROC статистически значимым. Я нашел много пакетов, имеющих дело с кривыми ROC:...

12
Термин частота / обратная частота документа (TF / IDF): взвешивание

У меня есть набор данных, который представляет 1000 документов и все слова, которые появляются в нем. Таким образом, строки представляют документы, а столбцы представляют слова. Так, например, значение в ячейке обозначает время, когда слово встречается в документе(i,j)(i,j)(i,j)jjj . Теперь я...

12
Требуется ли предварительная обработка перед прогнозированием с использованием FinalModel из RandomForest с пакетом Caret?

Я использую пакет caret для обучения объекта randomForest с 10x10CV. library(caret) tc <- trainControl("repeatedcv", number=10, repeats=10, classProbs=TRUE, savePred=T) RFFit <- train(Defect ~., data=trainingSet, method="rf", trControl=tc, preProc=c("center", "scale")) После этого я тестирую...

12
Проверка гипотезы на разницу в медиане между более чем двумя образцами

Вопрос Результаты тестов трех групп людей сохраняются в виде отдельных векторов в R. set.seed(1) group1 <- rnorm(100, mean = 75, sd = 10) group2 <- rnorm(100, mean = 85, sd = 10) group3 <- rnorm(100, mean = 95, sd = 10) Я хочу знать, есть ли значительная разница в медиане между этими...

12
Почему F-тест в гауссовых линейных моделях является наиболее мощным?

Y=μ+σGY=μ+σGY=\mu+\sigma Gμμ\muWWWGGGRnRn\mathbb{R}^nFFFH0:{μ∈U}H0:{μ∈U}H_0\colon\{\mu \in U\}U⊂WU⊂WU \subset Wf=ϕ(2logsupμ∈W,σ>0L(μ,σ|y)supμ∈U,σ>0L(μ,σ|y)).f=ϕ(2log⁡supμ∈W,σ>0L(μ,σ|y)supμ∈U,σ>0L(μ,σ|y)).f=\phi\left( 2\log \frac{\sup_{\mu \in W, \sigma>0} L(\mu, \sigma | y)}{\sup_{\mu...

12
Точный критерий Фишера и гипергеометрическое распределение

Я хотел лучше понять точный критерий Фишера, поэтому я разработал следующий пример игрушки, где f и m соответствуют мужской и женской части, а n и y соответствуют «потреблению соды», например: > soda_gender f m n 0 5 y 5 0 Очевидно, это резкое упрощение, но я не хотел, чтобы контекст мешал....

12
Рассчитать логарифмическое правдоподобие «вручную» для обобщенной нелинейной регрессии наименьших квадратов (nlme)

Я пытаюсь вычислить логарифмическую вероятность для обобщенной нелинейной регрессии наименьших квадратов для функции оптимизированной с помощью функция в пакете R , используя ковариационную матрицу дисперсии, генерируемую расстояниями на филогенетическом дереве, предполагающем броуновское движение...