Вопросы с тегом «r»

10
Альтернативный воронкообразный график, без использования стандартной ошибки (SE)

Перед отправкой моего метаанализа я хочу создать воронкообразный график для проверки на неоднородность и смещение публикаций. У меня есть объединенный размер эффекта и размеры эффекта от каждого исследования, которые принимают значения от -1 до +1. У меня есть размеры выборки n1, n2 для пациентов и...

10
Мета-анализ в R с использованием пакета метафор

Как мне следует синтаксически использовать rmaфункцию из пакета метафоры , чтобы получить результаты в следующем реальном примере небольшого мета-анализа? (случайный эффект, сводная статистика SMD) study, mean1, sd1, n1, mean2, sd2, n2 Foo2000, 0.78, 0.05, 20, 0.82, 0.07, 25 Sun2003, 0.74, 0.08,...

10
Как получить значения, используемые в plot.gam в mgcv?

Я хотел бы узнать значения, (x, y)используемые при построении графиков plot(b, seWithMean=TRUE)в пакете mgcv . Кто-нибудь знает, как я могу извлечь или вычислить эти значения? Вот пример: library(mgcv) set.seed(0) dat <- gamSim(1, n=400, dist="normal", scale=2) b <- gam(y~s(x0), data=dat)...

10
Лучшие методы выбора признаков для непараметрической регрессии

Вопрос новичка здесь. В настоящее время я выполняю непараметрическую регрессию, используя пакет np в R. У меня есть 7 функций, и я использую метод грубой силы, я определил лучшие 3. Но скоро у меня будет гораздо больше, чем 7 функций! Мой вопрос заключается в том, каковы в настоящее время лучшие...

10
Сложный регрессионный график в R

Мне нужно нарисовать сложную графику для визуального анализа данных. У меня есть 2 переменные и большое количество случаев (> 1000). Например (число равно 100, если дисперсия меньше "нормальной"): x <- rnorm(100,mean=95,sd=50) y <- rnorm(100,mean=35,sd=20) d <- data.frame(x=x,y=y) 1)...

10
Выберите уровень фактора в качестве фиктивной базы в lm () в R

Допустим, я регрессирую Y на X1 и X2, где X1 - числовая переменная, а X2 - коэффициент с четырьмя уровнями (A: D). Есть ли способ написать функцию линейной регрессии, lm(Y ~ X1 + as.factor(X2))чтобы я мог выбрать определенный уровень X2 - скажем, B - в качестве базовой...

10
Сравнение смешанной модели (субъект как случайный эффект) с простой линейной моделью (субъект как фиксированный эффект)

Я заканчиваю анализ большого набора данных. Я хотел бы взять линейную модель, использованную в первой части работы, и переоснастить ее, используя линейную смешанную модель (LME). LME будет очень похожим, за исключением того, что одна из переменных, используемых в модели, будет использоваться в...

10
Распараллеливание пакета caret с использованием doSMP

ОБНОВЛЕНИЕ: каретка теперь используется foreachвнутри, поэтому этот вопрос больше не актуален. Если вы можете зарегистрировать рабочий параллельный бэкэнд для foreach, caret будет использовать его. У меня есть пакет каретки для R, и мне интересно использовать trainфункцию для перекрестной проверки...

10
Как отобразить матрицу корреляций с отсутствующими записями?

Я хотел бы получить графическое представление корреляций в статьях, которые я собрал до сих пор, чтобы легко изучить взаимосвязи между переменными. Раньше я рисовал (грязный) график, но у меня сейчас слишком много данных. В основном у меня есть таблица с: [0]: имя переменной 1 [1]: имя переменной 2...

10
Анимация эффекта изменения ширины ядра в R

У меня есть некоторые данные в R, хранящиеся в списке. Считать d <- c(1,2,3,4) хотя это не мои данные. Если я тогда введите команду plot(density(d, kernel="gaussian", width=1)) тогда я получаю оценку плотности вероятности ядра, где ядро ​​стандартно нормально. Если я заменю 1 на другие числа,...

10
Как я могу объяснить пространственную ковариацию в линейной модели?

Фон У меня есть данные полевого исследования, в котором есть четыре уровня обработки и шесть повторностей в каждом из двух блоков. (4x6x2 = 48 наблюдений) Блоки находятся примерно в 1 миле друг от друга, а внутри блоков есть сетка из 42, 2 х 4 м участков и дорожка шириной 1 м; мое исследование...

10
Оптимизация среднего отклонения портфеля Марковица в R

У меня есть 5 серий общей доходности в иностранной валюте на развивающихся рынках, для которых я прогнозирую будущие доходности за один период (1 год). Я хотел бы построить портфель из пяти рядов, оптимизированный по Марковицу, используя исторические дисперсии и ковариации (1) и мой собственный...

10
Рекомендуемая процедура для факторного анализа на дихотомических данных с R

Мне нужно провести факторный анализ набора данных, состоящего из дихотомических переменных (0 = да, 1 = нет), и я не знаю, нахожусь ли я на правильном пути. Используя tetrachoric()я создаю корреляционную матрицу, по которой я бегу fa(data,factors=1). Результат довольно близок к результатам, которые...

10
Лучший способ взаимодействия с сеансом R, работающим в облаке

Locked . Этот вопрос и его ответы заблокированы, потому что вопрос не по теме, но имеет историческое значение. В настоящее время он не принимает новые ответы или взаимодействия. У меня R работает на Amazon EC2, используя модифицированную версию биокондуктора AMI . В настоящее время я использую...

10
Использовать ли смещение в регрессии Пуассона при прогнозировании общих карьерных целей, забитых хоккеистами

У меня вопрос по поводу того, стоит ли использовать смещение. Предположим, очень простая модель, где вы хотите описать (общее) количество голов в хоккее. Таким образом, у вас есть цели, количество сыгранных игр и фиктивная переменная «нападающий», которая равна 1, если игрок является нападающим, и...

10
Как оценить параметры для фильтра Калмана

В предыдущем вопросе я спросил о подгонке распределений к некоторым негауссовым эмпирическим данным. Мне было предложено в автономном режиме, чтобы я мог попробовать предположение, что данные гауссовские и сначала подходят для фильтра Калмана. Затем, в зависимости от ошибок, решите, стоит ли...

10
Есть ли у Андерсона дорогая проверка пригодности для двух наборов данных?

Я знаю, что ad.test () можно использовать для проверки нормальности. Можно ли получить ad.test для сравнения распределений из двух образцов данных? x <- rnorm(1000) y <- rgev(2000) ad.test(x,y) Как я могу выполнить тест Андерсона-Дарлинга на 2...

10
Разрешено ли включать время в качестве предиктора в смешанных моделях?

Я всегда считал, что время не должно использоваться в качестве предиктора в регрессиях (в том числе в игре), потому что тогда просто «описать» саму тенденцию. Если цель исследования состоит в том, чтобы найти такие параметры окружающей среды, как температура и т. Д., Которые объясняют разницу,...

10
Сравните R-квадрат из двух разных моделей Random Forest

Я использую пакет randomForest в R для разработки модели случайного леса, чтобы попытаться объяснить непрерывный результат в «широком» наборе данных с большим количеством предикторов, чем выборок. В частности, я подгоняю одну модель RF, позволяющую процедуре выбрать из набора ~ 75 переменных...

10
Объединение двух временных рядов путем усреднения точек данных

Я хотел бы объединить прогнозируемые и обратные (то есть прогнозируемые прошлые значения) данных временного ряда в один временной ряд, сводя к минимуму среднеквадратичную ошибку прогноза. Скажем, у меня есть временные ряды 2001–2010 годов с разрывом на 2007 год. Я смог прогнозировать 2007 год с...