Вопросы с тегом «linear-model»

13
Можете ли вы дать простое интуитивное объяснение метода IRLS, чтобы найти MLE GLM?

Фон: Я пытаюсь следовать обзору Принстона оценки MLE для GLM . Я понимаю основы оценки MLE: likelihood, score, наблюдаемая и ожидаемая Fisher informationи Fisher scoringтехника. И я знаю, как обосновать простую линейную регрессию с помощью оценки MLE . Вопрос: Я не могу понять даже первую строку...

13
Понимание создания фиктивных (ручных или автоматических) переменных в GLM

Если в формуле glm используется факторная переменная (например, пол с уровнями M и F), то создаются фиктивные переменные, которые можно найти в сводке модели glm вместе с соответствующими коэффициентами (например, полM) Если вместо того, чтобы полагаться на R для разделения коэффициента таким...

13
Семейство GLM представляет собой распределение переменной ответа или остатков?

Я обсуждал это с несколькими сотрудниками лаборатории, и мы обратились к нескольким источникам, но до сих пор не получили ответа: Когда мы говорим, что у GLM есть семейство пуассонов , скажем, мы говорим о распределении остатков или переменной отклика? Спорные вопросы Читая эту статью, она...

12
Как применить метод итеративно переоцененных наименьших квадратов (IRLS) к модели LASSO?

Я запрограммировал логистическую регрессию, используя алгоритм IRLS . Я хотел бы применить штраф LASSO для автоматического выбора правильных функций. На каждой итерации решается следующее: (XTWX)δβ^=XT(y−p)(XTWX)δβ^=XT(y−p)\mathbf{\left(X^TWX\right) \delta\hat\beta=X^T\left(y-p\right)} Пусть...

12
Логистическая регрессия со сплайнами регрессии в R

Я разрабатывал модель логистической регрессии на основе ретроспективных данных из национальной базы данных о травмах головы в Великобритании. Ключевым результатом является 30-дневная смертность (обозначается как «выживаемая» мера). Другие меры с опубликованным доказательством существенного влияния...

12
Ридж наказал GLM, используя увеличение строки?

Я читал, что регрессия гребня может быть достигнута простым добавлением строк данных в исходную матрицу данных, где каждая строка создается с использованием 0 для зависимых переменных и квадратного корня из Кkk или нуля для независимых переменных. Затем добавляется одна дополнительная строка для...

12
Сплайны в GLM и GAM

Неправильно ли, что сплайны доступны только в GAM-моделях, а не в GLM-моделях? Я слышал это некоторое время назад, и удивляюсь, является ли это просто заблуждением, или в этом есть доля правды. Вот иллюстрация:...

12
Сверхдисперсность и моделирование в пуассоновских моделях случайных эффектов со смещениями

Я столкнулся с рядом практических вопросов при моделировании данных подсчета из экспериментальных исследований с использованием эксперимента внутри объекта. Я кратко опишу эксперимент, данные и то, что я уже сделал, а затем мои вопросы. Четыре различных фильма были показаны выборке респондентов в...

12
Почему важно проводить различие между «линейной» и «нелинейной» регрессией?

Какова важность различия между линейными и нелинейными моделями? Вопрос Нелинейная и обобщенная линейная модель: как вы относитесь к логистической, пуассоновской и т. Д. Регрессии? и его ответ был чрезвычайно полезным разъяснением линейности / нелинейности обобщенных линейных моделей. Кажется...

12
Проблема со сравнением моделей GLM с другой функцией связи

Учитывая тот же набор ковариат и семейства распределений, как я могу сравнить модели, имеющие разные функции связи? Я думаю, что правильный ответ здесь - «AIC / BIC», но я не уверен на 100%. Можно ли иметь вложенные модели, если у них другая...

12
подбор экспоненциальной функции с использованием метода наименьших квадратов в сравнении с обобщенной линейной моделью в сравнении с нелинейным методом наименьших квадратов

У меня есть набор данных, который представляет экспоненциальный спад. Я хотел бы приспособить экспоненциальную функцию к этим данным. Я попытался лог преобразовать переменную ответа и затем использовать наименьшие квадраты, чтобы соответствовать линии; использование обобщенной линейной модели с...

12
Какие преимущества имеет пуассоновская регрессия по сравнению с линейной регрессией в этом случае?

Мне дали набор данных, который содержит количество наград, заработанных учащимися в одной средней школе, где предикторами количества полученных наград являются тип программы, в которую был зачислен учащийся, и балл по их итоговому экзамену по математике. Мне было интересно, может ли кто-нибудь...

12
Каково ожидаемое распределение остатков в обобщенной линейной модели?

Я выполняю обобщенную линейную модель, где я должен указать семью, отличную от нормальной. Каково ожидаемое распределение остатков? Например, должны ли остатки распределяться нормально?...

12
Манипулирование моделью логистической регрессии

Я хотел бы понять, что делает следующий код. Человек, который написал код, больше не работает здесь, и он почти полностью без документов. Меня попросили исследовать это кто-то, кто думает, что это "модель байесовской логистической регрессии " bglm <- function(Y,X) { # Y is a vector of binary...

12
Использование lm для 2-пробы

Некоторое время я использовал линейные модели для проведения тестов пропорции 2 образцов, но понял, что это может быть не совсем правильно. Похоже, что использование обобщенной линейной модели с биномиальной связью семейство + тождественность дает в точности результаты пула для 2-выборочной...

12
Теория весового аргумента в R при использовании lm ()

После года, проведенного в аспирантуре, мое понимание «взвешенных наименьших квадратов» таково: пусть , будет некоторой матрицей проектирования, \ boldsymbol \ beta \ in \ mathbb {R} ^ p - вектор параметров, \ boldsymbol \ epsilon \ in \ mathbb {R} ^ n - вектор ошибок, такой что \ boldsymbol \...

12
Проверка невязок на нормальность в обобщенных линейных моделях

Эта статья использует обобщенные линейные модели (как биномиальное, так и отрицательное биномиальное распределение ошибок) для анализа данных. Но затем в разделе методов статистического анализа есть следующее утверждение: ... и, во-вторых, путем моделирования данных присутствия с использованием...

12
Как выполнить вменение значений в очень большом количестве точек данных?

У меня очень большой набор данных и около 5% случайных значений отсутствуют. Эти переменные связаны друг с другом. В следующем примере набор данных R - просто игрушечный пример с фиктивными коррелированными данными. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000,...