Вопросы с тегом «r»

10
Выбор каретки для модели randomForest

У меня проблемы с пониманием того, как varImpфункция работает для модели randomForest с caretпакетом. В приведенном ниже примере функция var3 получает нулевую важность с помощью varImpфункции caret , но базовая конечная модель randomForest имеет ненулевую важность для функции var3. Почему это так?...

10
Как изменить порог для классификации в R randomForests?

Вся литература по моделированию распределения видов предполагает, что при прогнозировании присутствия / отсутствия вида с использованием модели, которая выводит вероятности (например, RandomForests), важен выбор пороговой вероятности, с помощью которой можно фактически классифицировать вид как...

10
Как мне моделировать взаимодействия между объясняющими переменными, если одна из них может иметь квадратные и кубические члены?

Я искренне надеюсь, что я сформулировал этот вопрос таким образом, чтобы на него можно было дать окончательный ответ - если нет, пожалуйста, дайте мне знать, и я попробую еще раз! Я должен также предположить, что я буду использовать R для этих анализов. У меня есть несколько мер, plant performance...

10
Как извлечь информацию из матрицы графика рассеяния, когда у вас большое N, дискретные данные и много переменных?

Я играю с набором данных о раке молочной железы и создал диаграмму рассеяния всех атрибутов, чтобы понять, какие из них оказывают наибольшее влияние на предсказание класса malignant(синий) benign(красный). Я понимаю, что строка представляет ось x, а столбец представляет ось y, но я не вижу, какие...

10
glm в R - какое значение pvalue соответствует качеству подгонки всей модели?

Я бегу glms в R (обобщенные линейные модели). Я думал, что знаю значения pvalue - пока не увидел, что вызов сводки для glm не дает вам превосходящего pvalue представителя модели в целом - по крайней мере, не там, где это делают линейные модели. Мне интересно, если это дано как значение для...

10
Ошибки обработки данных уже «учтены» в статистическом анализе?

Хорошо, честное предупреждение - это философский вопрос, в котором нет цифр. Я много размышлял о том, как ошибки проникают в наборы данных с течением времени и как это следует обрабатывать аналитикам - или это вообще должно иметь значение? Для справки, я делаю анализ долгосрочного исследования,...

10
Каковы критерии и решения для нелинейности в статистических моделях?

Я надеюсь, что следующий общий вопрос имеет смысл. Пожалуйста, имейте в виду, что для целей данного конкретного вопроса меня не интересуют теоретические (предметная область) причины введения нелинейности. Поэтому я сформулирую полный вопрос следующим образом: Какова логическая структура ( критерии...

10
Как получить таблицу ANOVA с устойчивыми стандартными ошибками?

Я запускаю объединенную регрессию OLS с использованием пакета plm в R. Хотя мой вопрос больше относится к базовой статистике, поэтому я постараюсь сначала опубликовать ее здесь;) Так как мои результаты регрессии дают гетероскедастические остатки, я хотел бы попробовать использовать устойчивые...

10
Bootstrap: оценка вне доверительного интервала

Я сделал начальную загрузку со смешанной моделью (несколько переменных с взаимодействием и одна случайная величина). Я получил этот результат (только частичный): > boot_out ORDINARY NONPARAMETRIC BOOTSTRAP Call: boot(data = a001a1, statistic = bootReg, R = 1000) Bootstrap Statistics : original...

10
Как найти p-значение гладкой регрессии сплайна / лёсса?

У меня есть некоторые переменные, и мне интересно найти нелинейные отношения между ними. Поэтому я решил добавить несколько сплайнов или лессов и напечатать красивые графики (см. Код ниже). Но я также хочу иметь некоторую статистику, которая дает мне представление о том, насколько вероятно, что...

10
VC-размерность k-ближайшего соседа

Каково VC-измерение алгоритма k-ближайшего соседа, если k равно количеству используемых тренировочных точек? Контекст: этот вопрос был задан в ходе курса, который я взял, и ответа было 0. Я, однако, не понимаю, почему это так. Моя интуиция заключается в том, что VC-Dimension должно быть 1, потому...

10
Подход и пример кластеризации графов в «R»

Я ищу, чтобы сгруппировать / объединить узлы в графе, используя кластеризацию графа в 'r'. Вот потрясающе игрушечный вариант моей проблемы. Есть два "кластера" Существует «мост», соединяющий кластеры Вот сеть-кандидат: Когда я смотрю на расстояние соединения, "hopcount", если хотите, то я могу...

10
Формула для байесовского А / Б тестирования не имеет никакого смысла

Я использую формулу из байесовского ab-тестирования , чтобы вычислить результаты теста AB, используя байесовскую методологию. Pr ( pВ> рA) = ∑я = 0αВ- 1B ( αA+ я , βВ+ βA)( βВ+ i ) B ( 1 + i , βВ) B ( αA, βA)Pr(пВ>пA)знак равноΣязнак равно0αВ-1В(αA+я,βВ+βA)(βВ+я)В(1+я,βВ)В(αA,βA) \Pr(p_B >...

10
Сравнение моделей со смешанными и фиксированными эффектами (тестирование значимости случайных эффектов)

Учитывая три переменные, yи x, которые являются положительными непрерывными, и z, что является категориальным, у меня есть две модели кандидатов, заданные: fit.me <- lmer( y ~ 1 + x + ( 1 + x | factor(z) ) ) а также fit.fe <- lm( y ~ 1 + x ) Я надеюсь сравнить эти модели, чтобы определить,...

10
Можете ли вы рассчитать мощность теста Колмогорова-Смирнова в R?

Можно ли провести силовой анализ для двустороннего теста Колмогорова Смирнова в R? Я проверяю, отличаются ли два эмпирических распределения с помощью ks.test (), и собираюсь добавить анализ мощности. Мне не удалось найти какой-либо встроенный анализ мощности для испытаний KS в R. Есть предложения?...

10
Оценить апостериорное прогнозирующее распределение в байесовской линейной регрессии

Я запутался в том, как оценивать апостериорное предиктивное распределение для байесовской линейной регрессии, за пределами основного случая, описанного здесь на странице 3 и скопированного ниже. р ( у~∣ у) = ∫р ( у~∣ β, σ2) p ( β, σ2∣ у)p(y~∣y)=∫p(y~∣β,σ2)p(β,σ2∣y) p(\tilde y \mid y) = \int...

10
О чем сообщает lsmeans для обобщенной линейной модели, такой как смешанная модель Пуассона (в соответствии с блеском)?

Я анализирую данные отслеживания глаз из разработанного эксперимента. Упрощенная версия моих данных выглядит следующим образом (Вы можете получить данные dput () здесь ), head(lookDATA) participant fixationImage fixationCount 1 9 Automobile 81 2 9 Bird 63 3 9 Chair 82 4 9 Dog 64 5 9 Face 90 6 9...

10
Как проверить, влияет ли «предыдущее состояние» на «последующее состояние» в R

Представьте себе ситуацию: у нас есть исторические записи (20 лет) о трех шахтах. Увеличивает ли присутствие серебра вероятность обнаружения золота в следующем году? Как проверить такой вопрос? Вот пример данных: mine_A <- c("silver","rock","gold","gold","gold","gold","gold",...

10
Вложенная перекрестная проверка - чем она отличается от выбора модели с помощью kfold CV на тренировочном наборе?

Я часто вижу людей, говорящих о перекрестной проверке 5x2 как частном случае вложенной перекрестной проверки . Я предполагаю, что первое число (здесь: 5) относится к числу сгибов во внутренней петле, а второе число (здесь: 2) относится к числу сгибов во внешней петле? Итак, чем это отличается от...