Вопросы с тегом «r»

9
Помогите мне приспособить эту нелинейную множественную регрессию, которая бросила вызов всем предыдущим усилиям

РЕДАКТИРОВАТЬ: С момента создания этого поста, я добавил еще один пост здесь . Краткое содержание текста ниже: я работаю над моделью и пробовал линейную регрессию, преобразования Бокса-Кокса и GAM, но не добился большого прогресса Используя R, я в настоящее время работаю над моделью, чтобы...

9
Стандартная ошибка наклона в кусочно-линейной регрессии с известными точками останова

Ситуация У меня есть набор данных с одной зависимой и одной независимой переменной . Я хочу согласовать непрерывную кусочно-линейную регрессию с известными / фиксированными точками останова, возникающими в . Точки останова известны без неопределенности, поэтому я не хочу их оценивать. Затем я...

9
Прогнозирование с помощью randomForest (R), когда некоторые входные данные имеют пропущенные значения (NA)

У меня есть прекрасная randomForestклассификационная модель, которую я хотел бы использовать в приложении, которое предсказывает класс нового случая. В новом случае неизбежно отсутствуют значения. Прогноз не будет работать как таковой для АН. Как мне тогда это сделать? data(iris) # create first the...

9
Правила применения симуляции Монте-Карло p-значений для критерия хи-квадрат

Я хотел бы понять использование моделирования Монте-Карло в chisq.test()функции в R. У меня есть качественная переменная, которая имеет 128 уровней / классов. Мой размер выборки составляет 26 (я не смог выбрать больше «отдельных лиц»). Поэтому очевидно, что у меня будет несколько уровней с 0...

9
Фурье / тригонометрическая интерполяция

Фон В статье Эпштейна (1991): При получении суточных климатологических значений из среднемесячных значений приводятся формулировка и алгоритм расчета интерполяции Фурье для периодических и равномерно распределенных значений. В статье цель состоит в том, чтобы получить ежедневные значения из...

9
Как лучше всего обрабатывать подсчета в мета-анализе?

Я провожу мета-анализ величин эффекта d в R с использованием пакета metafor. d представляет различия в показателях памяти между пациентами и здоровыми. Однако в некоторых исследованиях сообщается только о подсчетах интересующей меры d (например, несколько разных показателей памяти или оценки трех...

9
R / Caret: обучающие и тестовые наборы против перекрестной проверки?

Это может быть, возможно, глупый вопрос, но при создании модели с каретой и использовании чего-то вроде LOOCVили (даже более точно) LGOCV, какая польза от разделения данных на наборы обучающих и тестовых наборов, если это, по сути, шаг перекрестной проверки в любом случае? Я прочитал некоторые из...

9
AIC, ошибка anova: модели не все соответствуют одному и тому же количеству наблюдений, модели не все соответствуют одному и тому же размеру набора данных

У меня есть такие модели: require(nlme) set.seed(123) n <- 100 k <- 5 cat <- as.factor(rep(1:k, n)) cat_i <- 1:k # intercept per kategorie x <- rep(1:n, each = k) sigma <- 0.2 alpha <- 0.001 y <- cat_i[cat] + alpha * x + rnorm(n*k, 0, sigma) plot(x, y) m1 <- lm(y ~ x)...

9
Использование процентилей в качестве предикторов - хорошая идея?

Я думаю о проблеме, которая заключается в прогнозировании журнала (расходов) клиента с использованием линейной регрессии. Я рассматриваю, какие функции использовать в качестве входных данных, и задаюсь вопросом, будет ли нормально использовать процентиль переменной в качестве входных данных....

9
статистический тест, чтобы увидеть, является ли связь линейной или нелинейной

У меня есть пример данных, установленных следующим образом: Volume <- seq(1,20,0.1) var1 <- 100 x2 <- 1000000 x3 <- 30 x4 = sqrt(x2/pi) H = x3 - Volume r = (x4*H)/(H + Volume) Power = (var1*x2)/(100*(pi*Volume/3)*(x4*x4 + x4*r + r*r)) Power <- jitter(Power, factor = 1, amount = 0.1)...

9
Расчет прогнозируемого интервала

У меня есть следующие данные, расположенные здесь . Я пытаюсь рассчитать 95% доверительный интервал для средней чистоты, когда процент углеводородов равен 1,0. В R я ввожу следующее. > predict(purity.lm, newdata=list(hydro=1.0), interval="confidence", level=.95) fit lwr upr 1 89.66431 87.51017...

9
Использование анализа основных компонентов против анализа соответствия

Я анализирую набор данных, касающихся литоральных сообществ. Данные представляют собой процент покрытия (водорослей, ракушек, мидий и т. Д.) В квадратах. Я привык думать об анализе соответствия (CA) с точки зрения количества видов , а анализ основных компонентов (PCA) как о чем-то более полезном...

9
Моделирование футбольных матчей

В Dixon, Coles ( 1997 ) они использовали оценку максимального правдоподобия для двух модифицированных независимых моделей Пуассона в (4.3) для моделирования результатов в футболе. Я пытаюсь использовать R для того, чтобы «воспроизвести» альфа и бета, а также параметры домашнего эффекта (стр. 274,...

9
Имитация данных в соответствии с моделью посредничества

Я заинтересован в поиске процедуры для моделирования данных, которые соответствуют указанной модели посредничества. В соответствии с общей структурой модели линейных структурных уравнений для тестирования моделей посредничества, впервые описанной Barron и Kenny (1986) и описанной в других местах,...

9
Как оценить функцию векторной авторегрессии и импульсного отклика с данными панели

Я работаю над векторной авторегрессией (VAR) и оценкой функции импульсного отклика (IRF) на основе панельных данных с 33 индивидуумами в течение 77 кварталов. Как следует анализировать ситуацию такого типа? Какой алгоритм существует для этой цели? Я бы предпочел провести этот анализ в R, поэтому,...

9
Структура данных и вызов функции для данных повторяющихся событий с переменными во времени

Я пытаюсь оценить влияние 2 препаратов ( drug1, drug2) на вероятность падения пациента ( event). Пациенты могут падать более одного раза и могут быть введены или сняты с лекарств в любой момент. Мой вопрос заключается в том, как данные должны быть структурированы с учетом периода времени (дней), в...

9
Логистическая регрессия: максимизация истинных положительных результатов - ложных положительных результатов

У меня есть модель логистической регрессии (подходит через glmnet в R с упорядоченной упругой сетью), и я хотел бы максимизировать разницу между истинными положительными и ложными положительными сторонами. Для этого на ум пришла следующая процедура: Подходит стандартная модель логистической...

9
Оценка силы теста нормальности (в R)

Я хочу оценить точность тестов нормальности для разных размеров выборки в R (я понимаю, что тесты нормальности могут вводить в заблуждение ). Например, чтобы посмотреть на тест Шапиро-Уилка, я провожу следующую симуляцию (а также нанесение на график результатов) и ожидаю, что с увеличением размера...

9
R: Anova и линейная регрессия

Я новичок в статистике и пытаюсь понять разницу между ANOVA и линейной регрессией. Я использую R, чтобы исследовать это. Я читал различные статьи о том, почему ANOVA и регрессия различны, но все еще одинаковы, и как их можно визуализировать и т. Д. Я думаю, что я там довольно, но один бит все еще...

9
Индекс устойчивости населения - деление на ноль

Индекс стабильности населения количественно определяет изменение распределения переменной путем сравнения выборок данных за два периода времени. Это очень часто используется для измерения сдвигов в баллах. Он рассчитывается следующим образом: 1) Выборка из базового периода дискретизируется. Обычно...