Вопросы с тегом «model»

17
Как интерпретировать вывод предиката .coxph?

После подбора кокс-модели можно делать прогнозы и получать относительный риск новых данных. Что я не понимаю, так это то, как относительный риск рассчитывается для человека и к чему он относится (то есть для среднего населения)? Любые рекомендации по ресурсам, которые помогут понять (я не очень...

17
Почему именно бета-регрессия не может иметь дело с 0 и 1 в переменной ответа?

Бета-регрессия (т. Е. GLM с бета-распределением и, как правило, функцией логит-линка) часто рекомендуется для работы с зависимостью, называемой зависимой переменной, принимающей значения от 0 до 1, такие как дроби, соотношения или вероятности: регрессия для результата (соотношение или дробь) между...

16
Почему мы суетимся из-за использования очков Фишера, когда ставим GLM?

Мне любопытно, почему мы относимся к подгонке GLMS, как к какой-то особой проблеме оптимизации. Они? Мне кажется, что это просто максимальная вероятность, и мы записываем вероятность, а затем ... мы максимизируем ее! Так почему же мы используем оценку Фишера вместо множества схем оптимизации,...

16
Когда мы можем говорить о коллинеарности

В линейных моделях нам нужно проверить, существует ли связь между объясняющими переменными. Если они слишком сильно коррелируют, то возникает коллинеарность (то есть переменные частично объясняют друг друга). В настоящее время я просто смотрю на попарную корреляцию между каждой из объясняющих...

16
Пирсон В.С. Остатки отклонений в логистической регрессии

Я знаю, что стандартизированные остатки Пирсона получены традиционным вероятностным способом: ri=yi−πiπi(1−πi)−−−−−−−−√ri=yi−πiπi(1−πi) r_i = \frac{y_i-\pi_i}{\sqrt{\pi_i(1-\pi_i)}} и Остаточные отклонения получаются более статистическим способом (вклад каждой точки в вероятность):...

16
Стратегия выбора подходящей модели для подсчета данных

Какова подходящая стратегия для решения, какую модель использовать с данными подсчета? У меня есть данные подсчета, которые мне нужно моделировать как многоуровневые модели, и мне (на этом сайте) было рекомендовано, что лучший способ сделать это - через ошибки или MCMCglmm. Однако я все еще пытаюсь...

16
Происхождение обозначений в стиле Уилкинсона, таких как (1 | id) для случайных эффектов в формулах смешанных моделей в R

Модельные формулы в R, такие как y ~ x + a*b + c:d основаны на так называемой записи Уилкинсона : Уилкинсон и Роджерс 1973, Символическое описание факторных моделей для анализа отклонений . В этой статье не обсуждались нотации для смешанных моделей (которых тогда не могло быть). Так, где же...

16
Когда я должен * не * позволять фиксированному эффекту изменяться в зависимости от уровня случайного эффекта в модели смешанных эффектов?

Учитывая прогнозируемую переменную (P), случайный эффект (R) и фиксированный эффект (F), можно использовать две модели смешанных эффектов ( синтаксис lme4 ): m1 = lmer( P ~ (1|R) + F ) m2 = lmer( P ~ (1+F|R) + F) Насколько я понимаю, вторая модель - это та, которая позволяет фиксированному эффекту...

16
Почему нужно использовать REML (вместо ML) для выбора среди вложенных моделей var-covar?

Различные описания по выбору модели на случайные эффекты линейных смешанных моделей инструктируют использовать REML. Я знаю разницу между REML и ML на некотором уровне, но я не понимаю, почему REML следует использовать, потому что ML смещен. Например, неправильно ли проводить LRT для параметра...

16
Почему GLM отличается от LM с преобразованной переменной

Как поясняется в раздаточном материале этого курса (стр. 1) , линейная модель может быть записана в виде: y=β1x1+⋯+βpxp+εi,y=β1x1+⋯+βpxp+εi, y = \beta_1 x_{1} + \cdots + \beta_p x_{p} + \varepsilon_i, где - переменная ответа, а - пояснительная переменная .yyyxixix_{i}ithithi^{th} Часто с целью...

16
Классическая линейная модель - выбор модели

У меня классическая линейная модель, с 5 возможными регрессорами. Они не связаны друг с другом и имеют довольно низкую корреляцию с ответом. Я пришел к модели, в которой 3 регрессора имеют значимые коэффициенты для своей t-статистики (р <0,05). Добавление одной или обеих оставшихся 2 переменных...

16
Что может быть примером действительно простой модели с невероятной вероятностью?

Приближенное байесовское вычисление - это действительно классный метод для подгонки практически любой стохастической модели, предназначенный для моделей, в которых вероятность трудно поддается оценке (скажем, вы можете выбрать образец из модели, если вы исправите параметры, но вы не можете...

16
Как анализировать данные продольного счета: учет временной автокорреляции в GLMM?

Здравствуйте, статистические гуру и мастера программирования R, Я заинтересован в моделировании захвата животных в зависимости от условий окружающей среды и дня года. Как часть другого исследования, у меня есть подсчеты по ~ 160 дней за три года. В каждый из этих дней у меня есть температура,...

16
Какая лучшая книга об обобщенных линейных моделях для новичков?

Я все еще довольно новичок в обобщенных линейных моделях, и я борюсь со многими обозначениями в большинстве текстов GLM, которые я выбрал. Существуют ли чрезвычайно популярные книги по GLM, которые лучше...

16
Как бы вы объяснили обобщенные линейные модели людям без статистического фона?

Мне всегда трудно объяснить статистические методы аудитории без статистического фона. Если бы я хотел объяснить, что такое GLM для такой аудитории (не выбрасывая статистический жаргон), что было бы лучшим или наиболее эффективным способом? Я обычно объясняю GLM тремя частями - (1) случайный...

16
Имеет ли логарифмическая вероятность в GLM гарантированную сходимость к глобальным максимумам?

Мои вопросы: Обязательно ли обобщенные линейные модели (GLM) сходятся к глобальному максимуму? Если так, то почему? Кроме того, какие ограничения существуют для функции связи для обеспечения выпуклости? Мое понимание GLM состоит в том, что они максимизируют крайне нелинейную функцию правдоподобия....

16
Что такое R-структура G-структура в глмм?

Я недавно использовал MCMCglmmпакет. Меня смущает то, что в документации упоминается как R-структура и G-структура. Похоже, что они связаны со случайными эффектами - в частности, указанием параметров для предварительного распределения по ним, но обсуждение в документации, похоже, предполагает, что...

16
Смешанная модель и объединение стандартных ошибок для многосайтовых исследований. Почему смешанная модель намного эффективнее?

У меня есть набор данных, состоящий из серии ежемесячных подсчетов случаев «сломанной палки» с нескольких сайтов. Я пытаюсь получить единую сводную оценку из двух разных методов: Техника 1: Установите «сломанную палку» с Poisson GLM с переменной индикатора 0/1 и используя переменную времени и...

16
Правильная техника начальной загрузки для кластерных данных?

У меня есть вопрос относительно правильной методики начальной загрузки для использования с данными, где присутствует сильная кластеризация. Мне было поручено оценить многомерную модель прогнозирования смешанных эффектов для данных страховых требований путем оценки текущей базовой модели на более...