Вопросы с тегом «regression»

11
Какова мощность регрессионного теста F?

Классический F-тест для подмножеств переменных в полилинейной регрессии имеет вид где - сумма квадратов ошибок в «уменьшенной» модели, которая вложена в «большую» модель , а - степени свободы две модели. При нулевой гипотезе, что дополнительные переменные в «большой» модели не имеют линейной...

11
Какие остатки и расстояние Кука используются для GLM?

Кто-нибудь знает, какова формула расстояния Кука? В оригинальной формуле расстояния Кука используются нечеткие невязки, но почему R использует стандартное отклонение. Остатки Пирсона при расчете расстояния Кука для GLM. Я знаю, что для GLM не определены стедентифицированные невязки, но как выглядит...

11
Существуют ли какие-либо библиотеки для CART-подобных методов, использующих разреженные предикторы и ответы?

Я работаю с некоторыми большими наборами данных, используя пакет gbm в R. И моя матрица предикторов, и мой вектор ответов довольно редки (то есть большинство записей равно нулю). Я надеялся построить деревья решений, используя алгоритм, который использует преимущества этой редкости, как это было...

11
Должен ли я проводить отдельные регрессии для каждого сообщества или сообщество может быть просто управляющей переменной в агрегированной модели?

Я использую модель OLS с непрерывной переменной индекса ресурса в качестве DV. Мои данные собраны из трех аналогичных сообществ в географической близости друг к другу. Несмотря на это, я подумал, что важно использовать сообщество в качестве управляющей переменной. Как оказалось, сообщество значимо...

11
Правильное использование и интерпретация моделей с нулевой раздувкой

Фон: я биостатист, в настоящее время борюсь с набором данных о клеточной экспрессии. В ходе исследования некоторые пептиды подвергались воздействию множества клеток, собранных группами от различных доноров. Клетки либо экспрессируют определенные биомаркеры в ответ, либо нет. Частота ответов затем...

11
Отчетность о результатах простой линейной регрессии: какую информацию включить?

Я только что выполнил (очень) простую линейную регрессию в Genstat и хотел бы включить краткую и содержательную сводку результатов в мой отчет. Я не уверен, что именно или сколько информации я должен включать. Основные биты моего вывода Genstat выглядят так: Summary of analysis Source d.f. s.s....

11
Какие прогнозируемые значения возвращаются функцией предиката () в R при использовании исходных данных в качестве входных данных?

После запуска регрессии формы reg <- lm(y ~ x1 + x2, data=example)в наборе данных, я могу получить прогнозируемые значения, используя predict(reg, example, interval="prediction", level=0.95) Мне интересно, что на самом деле относятся к прогнозируемым значениям, когда я использую регрессию для...

11
Как рассчитать разницу двух склонов?

Есть ли способ понять, если две линии (более или менее) параллельны? У меня есть две линии, сгенерированные из линейных регрессий, и я хотел бы понять, параллельны ли они. Другими словами, я хотел бы получить разные наклоны этих двух линий. Есть ли функция R для расчета этого? РЕДАКТИРОВАТЬ: ... и...

11
Имеет ли смысл изучать графики невязок относительно зависимой переменной?

Я хотел бы знать, имеет ли смысл изучать графики невязок относительно зависимой переменной, когда я получаю одномерную регрессию. Если это имеет смысл, что означает сильная линейная растущая корреляция между остатками (по оси Y) и оценочными значениями зависимой переменной (по оси X)?...

11
Возможные расширения диагностических участков по умолчанию для lm (в R и в целом)?

Я начал немного копаться в функции plot.lm , эта функция дает шесть графиков для lm: График остатков от установленных значений График Scale-Location для sqrt (| остатки |) по отношению к подобранным значениям Нормальный график QQ, график расстояний Кука против меток строк График остатков против...

11
Случайный лес на сгруппированных данных

Я использую случайный лес на многомерных сгруппированных данных (50 числовых входных переменных), которые имеют иерархическую структуру. Данные были собраны с 6 повторениями в 30 положениях 70 различных объектов, что привело к 12600 точкам данных, которые не являются независимыми. Кажется, что...

11
Зачем использовать возраст в квадрате в качестве ковариации в исследовании генетической ассоциации?

Зачем использовать возраст и квадрат в качестве ковариат в исследовании генетической ассоциации? Я могу понять использование возраста, если он был определен как значимый ковариат, но я не знаю, как использовать возраст в...

11
Регрессия, основанная, например, на днях недели

Мне нужна небольшая помощь, чтобы двигаться в правильном направлении. Прошло много времени с тех пор, как я изучал статистику, и, похоже, жаргон изменился. Представьте, что у меня есть набор данных, связанных с автомобилем, таких как Время в пути от города А до города Б Расстояние от города А до...

11
Как осмыслить ошибку в регрессионной модели?

Я посещаю занятия по анализу данных, и некоторые из моих укоренившихся идей потрясены. А именно, идея о том, что ошибка (эпсилон), как и любой другой вид дисперсии, применима только (как я думал) к группе (выборке или целому населению). Теперь нас учат, что одним из допущений регрессии является то,...

11
Подгонка множественной линейной регрессии в R: автокоррелированные невязки

Я пытаюсь оценить множественную линейную регрессию в R с помощью следующего уравнения: regr <- lm(rate ~ constant + askings + questions + 0) Задания и вопросы представляют собой квартальные временные ряды данных, построенные с помощью askings <- ts(...). Проблема в том, что я получил...

11
Значимые предикторы становятся незначимыми при множественной логистической регрессии

Когда я анализирую свои переменные в двух отдельных (одномерных) моделях логистической регрессии, я получаю следующее: Predictor 1: B= 1.049, SE=.352, Exp(B)=2.85, 95% CI=(1.43, 5.69), p=.003 Constant: B=-0.434, SE=.217, Exp(B)=0.65, p=.046 Predictor 2: B= 1.379, SE=.386, Exp(B)=3.97, 95% CI=(1.86,...

11
Выявление выбросов для нелинейной регрессии

Я занимаюсь исследованиями в области функциональной реакции клещей. Я хотел бы сделать регрессию для оценки параметров (скорость атаки и время обработки) функции Роджерса типа II. У меня есть набор данных измерений. Как я могу лучше всего определить выбросы? Для моей регрессии я использую следующий...

11
Есть ли тест для пропущенного смещения переменной в OLS?

Мне известен тест «Сброс Рамси», который может обнаружить нелинейные зависимости. Однако, если вы просто выбрасываете один из коэффициентов регрессии (просто линейные зависимости), вы можете получить смещение в зависимости от корреляций. Это явно не обнаружено тестом сброса. Я не нашел тест для...

11
Риджу и ЛАССО дана ковариационная структура?

Прочитав главу 3 «Элементы статистического обучения» (Hastie, Tibshrani & Friedman), я подумал, возможно ли реализовать известные методы сжатия, указанные в названии этого вопроса, с учетом ковариационной структуры, т. Е. Минимизировать (возможно, более общее). ) количество ( у⃗ - Хβ⃗ )TВ-...

11
Диагональные прямые в графике остатков и подгоночных значений для множественной регрессии

Я наблюдаю странные закономерности в остатках для моих данных: [EDIT] Вот графики частичной регрессии для двух переменных: [EDIT2] Добавлен график PP Распределение, кажется, работает хорошо (см. Ниже), но я понятия не имею, откуда может идти эта прямая линия. Любые идеи? [ОБНОВЛЕНИЕ 31.07]...