Вопросы с тегом «regression»

9
Огромные коэффициенты в логистической регрессии - что это значит и что делать?

Я получаю огромные коэффициенты во время логистической регрессии, смотрите коэффициенты с krajULKV: > summary(m5) Call: glm(formula = cbind(ml, ad) ~ rok + obdobi + kraj + resid_usili2 + rok:obdobi + rok:kraj + obdobi:kraj + kraj:resid_usili2 + rok:obdobi:kraj, family = "quasibinomial") Deviance...

9
Загадка регрессии к среднему

В главе «Возвращение к среднему значению» Даниеля Канемана «Мышление, быстрое и медленное» приводится пример, и читателю предлагается спрогнозировать продажи отдельных магазинов с учетом общего прогноза продаж и показателей продаж за предыдущий год. , Например (пример книги имеет 4 магазина, я...

9
Значение p-значения переменных модели логистической регрессии

Итак, я работаю с моделями логистической регрессии в R. Хотя я все еще новичок в статистике, я чувствую, что уже получил некоторое понимание моделей регрессии, но есть еще кое-что, что меня беспокоит: Глядя на связанный рисунок, вы видите итоговую R-печать для примера модели, которую я создал....

9
Тип III суммы квадратов

У меня линейная регрессионная модель с одним категориальными переменными (мужчинами и женщинами) и одной непрерывной переменной .BAAAВBB Я устанавливаю контрастные коды в R с options(contrasts=c("contr.sum","contr.poly")). А теперь у меня есть суммы квадратов типа III для , и их взаимодействия (A:...

9
Теорема Гаусса-Маркова: СИНИЙ и МНК

Я читаю теорему Гасса-Маркова о википедии и надеялся, что кто-нибудь сможет помочь мне понять суть этой теоремы. Мы предполагаем, что линейная модель в матричной форме имеет вид: и мы ищем СИНИЙ, .y=Xβ+ηy=Xβ+η y = X\beta +\eta βˆβ^ \widehat\beta В соответствии с этим я бы обозначил как "остаток", а...

9
Путаница, связанная с нормализацией данных

Я пытаюсь выучить модель линейной регрессии. Однако у меня есть некоторая путаница, связанная с нормализацией данных. Я нормализовал особенности / предикторы к нулевому среднему значению и единице дисперсии. Нужно ли делать то же самое для цели. Если так, то...

9
как интерпретировать член взаимодействия в формуле lm в R?

В R, если я вызываю lm()функцию следующим образом: lm.1 = lm(response ~ var1 + var2 + var1 * var2) summary(lm.1) Это дает мне линейную модель переменной отклика с var1, var2и взаимодействие между ними. Однако как именно мы численно интерпретируем термин взаимодействия? Документация говорит, что это...

9
При каких допущениях обычный метод наименьших квадратов дает эффективные и объективные оценки?

Правда ли, что в предположениях Гаусса-Маркова обычный метод наименьших квадратов дает эффективные и объективные оценки? Так: для всех tЕ( тыT) = 0E(ut)=0E(u_t)=0 Ttt для t = sЕ( тыTUs) = σ2E(utus)=σ2E(u_tu_s)=\sigma^2 т = сt=st=s для т ≠ sЕ( тыTUs) = 0E(utus)=0E(u_tu_s)=0 т ≠ ыt≠st\neq s где...

9
Помогите мне приспособить эту нелинейную множественную регрессию, которая бросила вызов всем предыдущим усилиям

РЕДАКТИРОВАТЬ: С момента создания этого поста, я добавил еще один пост здесь . Краткое содержание текста ниже: я работаю над моделью и пробовал линейную регрессию, преобразования Бокса-Кокса и GAM, но не добился большого прогресса Используя R, я в настоящее время работаю над моделью, чтобы...

9
Стандартная ошибка наклона в кусочно-линейной регрессии с известными точками останова

Ситуация У меня есть набор данных с одной зависимой и одной независимой переменной . Я хочу согласовать непрерывную кусочно-линейную регрессию с известными / фиксированными точками останова, возникающими в . Точки останова известны без неопределенности, поэтому я не хочу их оценивать. Затем я...

9
Стремится ли скорректированный R-квадрат оценить фиксированную или случайную оценку популяции в квадрате?

Популяция r-квадрат может быть определена исходя из фиксированных или случайных оценок:ρ2ρ2\rho^2 Фиксированные оценки: размер выборки и конкретные значения предикторов остаются фиксированными. Таким образом, представляет собой долю дисперсии, объясняемой в результате уравнением регрессии...

9
Гауссовская проблема регрессии игрушек

Я пытался получить некоторую интуицию для регрессии Гауссова процесса, поэтому я сделал простую 1D игрушечную задачу, чтобы попробовать. Я взял в качестве входных данных, а y i = { 1 , 4 , 9 } в качестве ответов. («Вдохновленный» от y = x 2 )Икся= { 1 , 2 , 3 }xi={1,2,3}x_i=\{1,2,3\}Yя= { 1 , 4 , 9...

9
Как лучше всего обрабатывать подсчета в мета-анализе?

Я провожу мета-анализ величин эффекта d в R с использованием пакета metafor. d представляет различия в показателях памяти между пациентами и здоровыми. Однако в некоторых исследованиях сообщается только о подсчетах интересующей меры d (например, несколько разных показателей памяти или оценки трех...

9
Добавление весов для сильно искаженных наборов данных в логистической регрессии

Я использую стандартную версию логистической регрессии для подгонки моих входных переменных к двоичным выходным переменным. Однако в моей задаче отрицательные выходы (0 с) намного превосходят положительные (1 с). Соотношение составляет 20: 1. Поэтому, когда я обучаю классификатор, кажется, что даже...

9
Использование процентилей в качестве предикторов - хорошая идея?

Я думаю о проблеме, которая заключается в прогнозировании журнала (расходов) клиента с использованием линейной регрессии. Я рассматриваю, какие функции использовать в качестве входных данных, и задаюсь вопросом, будет ли нормально использовать процентиль переменной в качестве входных данных....

9
статистический тест, чтобы увидеть, является ли связь линейной или нелинейной

У меня есть пример данных, установленных следующим образом: Volume <- seq(1,20,0.1) var1 <- 100 x2 <- 1000000 x3 <- 30 x4 = sqrt(x2/pi) H = x3 - Volume r = (x4*H)/(H + Volume) Power = (var1*x2)/(100*(pi*Volume/3)*(x4*x4 + x4*r + r*r)) Power <- jitter(Power, factor = 1, amount = 0.1)...

9
Расчет прогнозируемого интервала

У меня есть следующие данные, расположенные здесь . Я пытаюсь рассчитать 95% доверительный интервал для средней чистоты, когда процент углеводородов равен 1,0. В R я ввожу следующее. > predict(purity.lm, newdata=list(hydro=1.0), interval="confidence", level=.95) fit lwr upr 1 89.66431 87.51017...

9
Использование логистической регрессии для непрерывной зависимой переменной

Недавно я получил ревизию для своей исследовательской работы, и ниже приводится комментарий рецензента к моей статье: результаты, полученные на одной модели, не совсем убедительны, особенно линейная регрессия обычно имеет недостатки в работе с выбросами. Я предлагаю авторам также попробовать...

9
Интерпретация оценки ошибок из пакета для RandomForestRegressor

Я использую регрессор RandomForest для своих данных, и я мог видеть, что показатель oob был получен равным 0,83. Я не уверен, как это получилось, чтобы быть таким. Я имею в виду, что мои цели - высокие значения в диапазоне 10 ^ 7. Так что, если это MSE, то это должно было быть намного выше. Я не...

9
Имитация данных в соответствии с моделью посредничества

Я заинтересован в поиске процедуры для моделирования данных, которые соответствуют указанной модели посредничества. В соответствии с общей структурой модели линейных структурных уравнений для тестирования моделей посредничества, впервые описанной Barron и Kenny (1986) и описанной в других местах,...