Вопросы с тегом «r»

35
Почему увеличение размера выборки уменьшает дисперсию (выборку)?

Большая фотография: Я пытаюсь понять, как увеличение размера выборки увеличивает мощность эксперимента. Слайды моего лектора объясняют это картиной из 2 нормальных распределений, одно для нулевой гипотезы и одно для альтернативной гипотезы и порога принятия решения c между ними. Они утверждают, что...

35
Логистическая регрессия: критерий хи-квадрат anova против значимости коэффициентов (anova () против суммарного () в R)

У меня есть логистическая модель GLM с 8 переменными. Я anova(glm.model,test='Chisq')выполнил тест хи-квадрат в R, и 2 переменные оказываются прогнозирующими, если их упорядочивать в верхней части теста, и не так сильно, когда их упорядочивают в нижней части. Предполагается, summary(glm.model)что...

34
Как интерпретировать среднее снижение точности и среднее снижение GINI в моделях случайных лесов

У меня возникают трудности с пониманием того, как интерпретировать выходные данные переменной важности из пакета Random Forest. Среднее снижение точности обычно описывается как «снижение точности модели из-за изменения значений в каждой функции». Это утверждение о функции в целом или о конкретных...

34
Модель смешанных эффектов с вложенностью

У меня есть данные, собранные из эксперимента, организованного следующим образом: Два участка, каждый с 30 деревьями. 15 лечат, 15 контролируют на каждом участке. Из каждого дерева мы отбираем три куска ствола и три куска корней, так что по 6 образцов первого уровня на дерево, которое представлено...

34
Почему логистическая регрессия становится нестабильной, когда классы хорошо разделены?

Почему логистическая регрессия становится нестабильной, когда классы хорошо разделены? Что значит хорошо разделенные классы? Я был бы очень признателен, если бы кто-то мог объяснить на...

34
Почему существует разница между ручным вычислением 95-процентного доверительного интервала и использованием функции confint () в R?

Дорогие, я заметил нечто странное, что не могу объяснить, не так ли? В итоге: ручной подход к вычислению доверительного интервала в модели логистической регрессии и функция R confint()дают разные результаты. Я проходил Прикладную логистическую регрессию Хосмера и Лемешоу (2-е издание). В 3-й главе...

34
R - Запутано в остаточной терминологии

Средняя квадратическая ошибка остаточная сумма квадратов остаточная стандартная ошибка средняя квадратическая ошибка ошибка теста Я думал, что привык понимать эти термины, но чем больше я сталкиваюсь со статистическими проблемами, тем больше я запутываюсь в том, что я сам себя угадаю. Я хотел бы...

33
Как обучить и проверить модель нейронной сети в R?

Я новичок в моделировании с нейронными сетями, но мне удалось создать нейронную сеть со всеми доступными точками данных, которая хорошо соответствует наблюдаемым данным. Нейронная сеть была сделана в R с пакетом nnet: require(nnet) ##33.8 is the highest value mynnet.fit <- nnet(DOC/33.80 ~ .,...

33
В поисках квартилей в R

Я изучаю учебник по статистике, изучая R, и наткнулся на камень преткновения в следующем примере: После просмотра ?quantileя попытался воссоздать это в R следующим образом: > nuclear <- c(7, 20, 16, 6, 58, 9, 20, 50, 23, 33, 8, 10, 15, 16, 104) > quantile(nuclear) 0% 25% 50% 75% 100% 6.0...

33
Что такое апостериорные прогностические проверки и что делает их полезными?

Я понимаю, что такое апостериорное предиктивное распределение , и я читал о апостериорных прогностических проверках , хотя мне пока не ясно, что он делает. Что такое задняя предиктивная проверка? Почему некоторые авторы говорят, что выполнение апостериорных прогностических проверок "использует...

33
Различия между расстоянием Бхаттачарья и расхождением КЛ

Я ищу интуитивное объяснение для следующих вопросов: В статистике и теории информации, в чем разница между расстоянием Бхаттачарьи и расхождением KL, как мерами разницы между двумя дискретными распределениями вероятностей? Разве они не имеют абсолютно никаких отношений и измеряют расстояние между...

33
Стандартная кластеризация ошибок в R (вручную или в plm)

Я пытаюсь понять стандартную ошибку «кластеризация» и как выполнить в R (это тривиально в Stata). В РИ были неудачные попытки использования либо plmнаписания моей собственной функции. Я буду использовать diamondsданные из ggplot2пакета. Я могу сделать фиксированные эффекты с помощью фиктивных...

32
Как R обрабатывает пропущенные значения в lm?

Я хотел бы регрессировать вектор B против каждого из столбцов в матрице A. Это тривиально, если нет пропущенных данных, но если матрица A содержит пропущенные значения, тогда моя регрессия против A ограничена включением только тех строк, где все значения присутствуют ( поведение na.omit по...

32
Почему R возвращает NA как коэффициент lm ()?

Я подгоняю lm()модель к набору данных, который включает индикаторы для финансового квартала (Q1, Q2, Q3, делая Q4 по умолчанию). Используя lm(Y~., data = data) я получаю в NAкачестве коэффициента для Q3 и предупреждение о том, что одна переменная была исключена из-за особенностей. Нужно ли...

32
Сравнение двух моделей с использованием функции anova () в R

Из документации для anova(): Когда задана последовательность объектов, anova проверяет модели друг против друга в указанном порядке ... Что значит проверять модели друг против друга? И почему порядок имеет значение? Вот пример из учебника GenABEL : > modelAdd = lm(qt~as.numeric(snp1)) >...

32
Как рассчитать относительную ошибку, когда истинное значение равно нулю?

Как рассчитать относительную ошибку, когда истинное значение равно нулю? Скажем, у меня есть и . Если я определю относительную ошибку как:х Руководство T E сек тИкст т у й= 0ИксTрUезнак равно0x_{true} = 0ИксТ Е сек тИксTеsTx_{test} относительная ошибка = хт т у й- хТ Е сек тИкст т у йотносительная...

32
Как мне соответствовать многоуровневой модели для перераспределенных результатов по пуассону?

Я хочу установить многоуровневый GLMM с распределением Пуассона (с избыточной дисперсией), используя R. В настоящее время я использую lme4, но я заметил, что недавно quasipoissonсемейство было удалено. В другом месте я видел, что вы можете моделировать аддитивную избыточную дисперсию для...

32
Как изменить данные между широким и длинным форматами в R? [закрыто]

Вы можете иметь данные в широком формате или в длинном формате. Это довольно важная вещь, так как используемые методы различаются в зависимости от формата. Я знаю, что вы должны работать melt()иcast() пакетом измененных форм из него, но есть некоторые вещи, которые я не понимаю. Может кто-нибудь...