Вопросы с тегом «r»

21
СКО против коэффициента определения

Я оцениваю физическую модель и хотел бы знать, какой из методов мне следует использовать здесь (между RMSE и Коэффициент определения R2) Проблема заключается в следующем: у меня есть функция, которая выводит прогнозы для входного значения x, . У меня также есть фактическое наблюдение для этого...

21
Источники для изучения (не только бега) статистики / математики через R

Мне интересны примеры источников (R-код, R-пакеты, книги, главы книг, статьи, ссылки и т. Д.) Для изучения статистических и математических понятий через R (это также может быть и через другие языки, но R - мой любимый вариант). Проблема в том, что изучение материала основано на программировании, а...

21
Как рассчитать качество посадки в glm (R)

У меня есть следующий результат от запуска функции GLM. Как я могу интерпретировать следующие значения: Нулевое отклонение Остаточное отклонение AIC Они имеют какое-то отношение к совершенству? Могу ли я рассчитать некоторую степень достоверности соответствия по этим результатам, таким как...

21
Как контролировать стоимость ошибочной классификации в случайных лесах?

Можно ли контролировать стоимость ошибочной классификации в пакете R randomForest ? В моей собственной работе ложные отрицания (например, отсутствие по ошибке того, что у человека может быть заболевание) намного дороже ложных срабатываний. Пакет rpart позволяет пользователю контролировать затраты...

21
Наличие сопряженного априора: глубокая собственность или математическая случайность?

Некоторые дистрибутивы имеют сопряженные приоры, а некоторые нет. Это различие просто случайность? То есть вы занимаетесь математикой, и она работает так или иначе, но на самом деле она не говорит вам ничего важного о распределении, кроме самого факта? Или наличие или отсутствие сопряженного...

21
Важность предикторов в множественной регрессии: частичное против стандартизированных коэффициентов

Мне интересно, какова точная связь между частичным и коэффициентами в линейной модели и должен ли я использовать только один или оба, чтобы проиллюстрировать важность и влияние факторов.R2R2R^2 Насколько я знаю, с помощью summaryя получаю оценки коэффициентов, а с anovaсуммой квадратов для каждого...

21
Случайный лес против регрессии

Я запустил модель регрессии МНК на наборе данных с 5 независимыми переменными. Независимые переменные и зависимые переменные являются непрерывными и линейно связаны. Площадь R составляет около 99,3%. Но когда я запускаю то же самое, используя случайный лес в R, мой результат выглядит так: «% Var...

21
Задний очень отличается от предыдущего и вероятности

Если априор и вероятность сильно отличаются друг от друга, то иногда возникает ситуация, когда апостериор не похож ни на один из них. Посмотрите, например, эту картинку, которая использует нормальные распределения. Хотя это математически правильно, это, похоже, не соответствует моей интуиции - если...

21
Лог-линейная регрессия против логистической регрессии

Может ли кто-нибудь предоставить четкий список различий между логарифмической регрессией и логистической регрессией? Я понимаю, что первая - это простая модель линейной регрессии, но я не знаю, когда следует использовать каждую из...

21
Должен ли байесовский апостериор иметь правильное распределение?

Я знаю, что априорные значения не обязательно должны быть правильными и что функция правдоподобия также не интегрируется с 1. Но должен ли апостериор быть правильным распределением? Каковы последствия, если это /...

21
Как применить биномиальный GLMM (glmer) к процентам, а не к счетам да-нет?

У меня есть эксперимент с повторными измерениями, где зависимая переменная представляет собой процент, и у меня есть несколько факторов в качестве независимых переменных. Я хотел бы использовать glmerиз пакета R, lme4чтобы рассматривать его как проблему логистической регрессии (путем указания...

21
Какова связь между показателем GINI и отношением логарифмического правдоподобия?

Я изучаю деревья классификации и регрессии, и одним из показателей местоположения разделения является оценка GINI. Теперь я привык определять лучшее место разделения, когда логарифм отношения правдоподобия одних и тех же данных между двумя распределениями равен нулю, что означает, что вероятность...

21
Как интерпретировать параметры в GLM с семейством = гамма

Этот вопрос был перенесен из переполнения стека, потому что на него можно ответить по перекрестной проверке. Мигрировал 5 лет назад . У меня есть вопрос, касающийся интерпретации параметров для GLM с гамма-распределенной зависимой переменной. Вот что R возвращает для моего GLM с лог-ссылкой: Call:...

21
Как проверить, является ли мой дистрибутив мультимодальным?

Когда я строю гистограмму моих данных, она имеет два пика: Означает ли это потенциальное мультимодальное распределение? Я запустил dip.testв R ( library(diptest)), и вывод: D = 0.0275, p-value = 0.7913 Я могу заключить, что мои данные имеют мультимодальное распределение? ДАННЫЕ 10346 13698 13894...

21
Как вы можете визуализировать отношения между 3 категориальными переменными?

У меня есть набор данных с тремя категориальными переменными, и я хочу визуализировать отношения между всеми тремя на одном графике. Любые идеи? В настоящее время я использую следующие три графика: Каждый график показывает уровень базовой депрессии (слабый, умеренный, тяжелый). Затем на каждом...

21
Почему квазипуассон в GLM не рассматривается как частный случай отрицательного бинома?

Я пытаюсь приспособить обобщенные линейные модели к некоторым наборам данных подсчета, которые могут быть или не быть перераспределены. Здесь применимы два канонических распределения: Пуассон и Отрицательный бином (Негбин) с EV и дисперсией.μμ\mu Вгп= μВaрпзнак равноμVar_P = \mu ВгNВ= μ +...

21
Почему nls () выдаёт мне ошибку «матрица сингулярного градиента при начальных оценках параметров»?

У меня есть некоторые основные данные о сокращении выбросов и стоимости автомобиля: q24 <- read.table(text = "reductions cost.per.car 50 45 55 55 60 62 65 70 70 80 75 90 80 100 85 200 90 375 95 600 ",header = TRUE, sep = "") Я знаю, что это экспоненциальная функция, поэтому я ожидаю, что смогу...

21
Разница между скрытыми марковскими моделями и фильтром частиц (и фильтром Калмана)

Вот мой старый вопрос Я хотел бы спросить, знает ли кто-нибудь разницу (если есть какая-либо разница) между скрытыми марковскими моделями (HMM) и Particle Filter (PF), и, как следствие, Kalman Filter, или при каких обстоятельствах мы используем какой алгоритм. Я студент, и я должен сделать проект,...

21
Какова интуиция, лежащая в основе определения полноты в статистике как невозможности сформировать из нее несмещенную оценку

В классической статистике есть определение, что статистика TTT набора данных определена как полная для параметра которого невозможно сформировать несмещенную оценку из нее нетривиально. То есть, единственный способ иметь для всех , чтобы иметь быть почти наверняка.y1,…,yny1,…,yny_1, \ldots,...