Вопросы с тегом «generalized-linear-model»

12
Проверка невязок на нормальность в обобщенных линейных моделях

Эта статья использует обобщенные линейные модели (как биномиальное, так и отрицательное биномиальное распределение ошибок) для анализа данных. Но затем в разделе методов статистического анализа есть следующее утверждение: ... и, во-вторых, путем моделирования данных присутствия с использованием...

12
Как выполнить вменение значений в очень большом количестве точек данных?

У меня очень большой набор данных и около 5% случайных значений отсутствуют. Эти переменные связаны друг с другом. В следующем примере набор данных R - просто игрушечный пример с фиктивными коррелированными данными. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000,...

12
Можно ли оценить GLM в Python / scikit-learn, используя распределения Пуассона, Гаммы или Твиди как семейство для распределения ошибок?

Пытаюсь выучить немного Python и Sklearn, но для своей работы мне нужно запустить регрессии, которые используют распределения ошибок из семейств Пуассона, Гаммы и особенно семейства Твиди. Я ничего не вижу в документации о них, но они есть в нескольких частях дистрибутива R, поэтому мне было...

12
Логистическая регрессия со сплайнами регрессии в R

Я разрабатывал модель логистической регрессии на основе ретроспективных данных из национальной базы данных о травмах головы в Великобритании. Ключевым результатом является 30-дневная смертность (обозначается как «выживаемая» мера). Другие меры с опубликованным доказательством существенного влияния...

12
Для усреднения модели GLM, мы усредняем прогнозы по ссылке или шкале ответов?

Вычислить усредненные по модели прогнозы по шкале отклика GLM, которая является «правильной» и почему? Вычислить усредненный прогноз по шкале канала и затем преобразовать обратно в шкалу ответов, или Обратно преобразовать прогнозы в шкалу ответов, а затем вычислить среднее по модели Прогнозы...

12
Сверхдисперсность и моделирование в пуассоновских моделях случайных эффектов со смещениями

Я столкнулся с рядом практических вопросов при моделировании данных подсчета из экспериментальных исследований с использованием эксперимента внутри объекта. Я кратко опишу эксперимент, данные и то, что я уже сделал, а затем мои вопросы. Четыре различных фильма были показаны выборке респондентов в...

12
Сплайны в GLM и GAM

Неправильно ли, что сплайны доступны только в GAM-моделях, а не в GLM-моделях? Я слышал это некоторое время назад, и удивляюсь, является ли это просто заблуждением, или в этом есть доля правды. Вот иллюстрация:...

12
Ридж наказал GLM, используя увеличение строки?

Я читал, что регрессия гребня может быть достигнута простым добавлением строк данных в исходную матрицу данных, где каждая строка создается с использованием 0 для зависимых переменных и квадратного корня из Кkk или нуля для независимых переменных. Затем добавляется одна дополнительная строка для...

11
Как я могу адаптировать ANOVA для двоичных данных?

У меня есть четыре конкурирующих модели, которые я использую, чтобы предсказать бинарную переменную результата (скажем, статус занятости после окончания, 1 = занятый, 0 = не занятый) для n предметов. Естественным показателем производительности модели является коэффициент попадания, который...

11
Сколько дистрибутивов в GLM?

Я определил несколько мест в учебниках, где GLM описан с 5 распределениями (а именно: гамма, гауссовский, биномиальный, обратный гауссовский и пуассоновский). Это также иллюстрируется в функции семьи в R. Иногда я сталкиваюсь с ссылками на GLM, где включены дополнительные дистрибутивы ( пример )....

11
Параметр дисперсии в выходных данных GLM

Я запустил glm в R, и в нижней части summary()вывода, он заявляет (Dispersion parameter for gaussian family taken to be 28.35031) Я покопался в Google и узнал, что параметр дисперсии используется для соответствия стандартным ошибкам. Я надеюсь, что кто-то может предоставить более подробную...

11
Могут ли эти данные быть объединены в пропорции для биномиального глм?

Мы попросили 60 человек перечислить как можно больше ресторанных франшиз в Атланте. Общий список включал более 70 ресторанов, но мы исключили те, которые были упомянуты менее чем 10% людей, оставив нам 45. Для этих 45 мы рассчитали долю информантов, которые перечислили франшизу, и нас интересует...

11
Анализ обогащения по уровню дупликации генов

Биологический Фон Со временем некоторые виды растений имеют тенденцию дублировать свои полные геномы, получая дополнительную копию каждого гена. Из-за нестабильности этой установки многие из этих генов затем удаляются, и геном перестраивается и стабилизируется, готовый к повторному дублированию....

11
Как бороться с «нецелым» предупреждением от отрицательного биномиального GLM?

Я пытаюсь смоделировать среднюю интенсивность паразитов, воздействующих на хозяина в R, используя отрицательную биномиальную модель. Я продолжаю получать 50 или более предупреждений, которые говорят: In dpois(y, mu, log = TRUE) : non-integer x = 251.529000 Как я могу справиться с этим? Мой код...

11
R / mgcv: Почему тензорные продукты te () и ti () производят разные поверхности?

mgcvПакет Rимеет две функции для установки взаимодействия Тензор продукта: te()и ti(). Я понимаю основное разделение труда между ними (подгонка нелинейного взаимодействия против разложения этого взаимодействия на основные эффекты и взаимодействие). Чего я не понимаю, так это почему te(x1, x2)и...

11
Логистическая регрессия и точка перегиба

У нас есть данные с двоичным результатом и некоторыми ковариатами. Я использовал логистическую регрессию для моделирования данных. Просто простой анализ, ничего необычного. Предполагается, что конечным результатом будет кривая доза-эффект, где мы показываем, как изменяется вероятность для...

11
Тест отношения правдоподобия и тест Вальда дают разные выводы для glm в R

Я воспроизводлю пример из обобщенных, линейных и смешанных моделей . Мой MWE ниже: Dilution <- c(1/128, 1/64, 1/32, 1/16, 1/8, 1/4, 1/2, 1, 2, 4) NoofPlates <- rep(x=5, times=10) NoPositive <- c(0, 0, 2, 2, 3, 4, 5, 5, 5, 5) Data <- data.frame(Dilution, NoofPlates, NoPositive) fm1 <-...

11
Всегда ли существует каноническая функция связи для обобщенной линейной модели (GLM)?

В GLM предполагается скаляр YYY и θθ\theta для базового распределения с pdf еY( у| θ,τ) = ч ( у, т) опыт( θ у- A ( θ )d( τ))fY(y|θ,τ)=h(y,τ)exp⁡(θy−A(θ)d(τ))f_Y(y | \theta, \tau) = h(y,\tau) \exp{\left(\frac{\theta y - A(\theta)}{d(\tau)} \right)} Можно показать, чтоμ=E(Y)=A′(θ)μ=E⁡(Y)=A′(θ) \mu =...

11
Как выбрать вероятность отсечения для редкого события Логистическая регрессия

У меня есть 100 000 наблюдений (9 фиктивных переменных индикатора) с 1000 положительных результатов. Логистическая регрессия должна работать нормально в этом случае, но вероятность отсечения озадачивает меня. В обычной литературе мы выбираем 50% -ное сокращение, чтобы предсказать 1 и 0. Я не могу...

11
Байесовская модель логита - интуитивное объяснение?

Я должен признаться, что раньше я не слышал об этом термине ни в одном из моих классов, старшекурсников или выпускников. Что значит для логистической регрессии быть байесовским? Я ищу объяснение с переходом от обычной логистики к байесовской логистике, подобное следующему: Это уравнение в модели...