Вопросы с тегом «model»

16
Происхождение обозначений в стиле Уилкинсона, таких как (1 | id) для случайных эффектов в формулах смешанных моделей в R

Модельные формулы в R, такие как y ~ x + a*b + c:d основаны на так называемой записи Уилкинсона : Уилкинсон и Роджерс 1973, Символическое описание факторных моделей для анализа отклонений . В этой статье не обсуждались нотации для смешанных моделей (которых тогда не могло быть). Так, где же...

16
Правильная техника начальной загрузки для кластерных данных?

У меня есть вопрос относительно правильной методики начальной загрузки для использования с данными, где присутствует сильная кластеризация. Мне было поручено оценить многомерную модель прогнозирования смешанных эффектов для данных страховых требований путем оценки текущей базовой модели на более...

15
Смешивать непрерывные и двоичные данные с линейным SVM?

Так что я играл с SVM, и мне интересно, хорошо ли это делать: У меня есть набор непрерывных функций (от 0 до 1) и набор категориальных функций, которые я преобразовал в фиктивные переменные. В этом конкретном случае я кодирую дату измерения в фиктивной переменной: У меня есть 3 периода, из которых...

15
VIF, индекс состояния и собственные значения

В настоящее время я оцениваю мультиколлинеарность в моих наборах данных. Какие пороговые значения VIF и индекса состояния ниже / выше указывают на проблему? VIF: я слышал, что VIF является проблемой.≥ 10≥10\geq 10 После удаления двух проблемных переменных VIF равен для каждой переменной. Нужно ли...

15
Точность градиентной машины уменьшается с увеличением числа итераций

Я экспериментирую с алгоритмом машины повышения градиента через caretпакет в R. Используя небольшой набор данных для поступления в колледж, я запустил следующий код: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create...

15
Каковы различия между «Моделированием смешанных эффектов» и «Моделированием скрытого роста»?

Я неплохо знаком с моделями смешанных эффектов (MEM), но недавно один из коллег спросил меня, как они соотносятся с моделями скрытого роста (LGM). Я немного погуглил, и кажется, что LGM - это вариант моделирования структурных уравнений, который применяется к обстоятельствам, когда повторяющиеся...

15
Модель Кокса против логистической регрессии

Допустим, нам дали следующую проблему: Предскажите, какие клиенты, скорее всего, прекратят покупки в нашем магазине в ближайшие 3 месяца. Для каждого клиента мы знаем месяц, когда он начал покупать в нашем магазине, и, кроме того, у нас есть много поведенческих особенностей в ежемесячных агрегатах....

15
Написание математического уравнения для многоуровневой модели смешанных эффектов

Вопрос CV Я пытаюсь дать (а) подробное и краткое математическое представление (я) модели смешанных эффектов. Я использую lme4пакет в R. Каково правильное математическое представление для моей модели? Данные, научный вопрос и код R Мой набор данных состоит из видов в разных регионах. Я проверяю,...

15
Если я повторю каждое наблюдение выборки в модели линейной регрессии и перезапущу регрессию, как повлияет на результат?

Скажем, у меня есть N наблюдений, возможно, несколько факторов, и я повторяю каждое наблюдение дважды (или М раз), как регрессия на этом новом наборе ЯМ размера будет сравниваться с регрессией только на исходных...

15
Понимание QR-разложения

У меня есть рабочий пример (в R), который я пытаюсь понять дальше. Я использую Limma для создания линейной модели, и я пытаюсь понять, что происходит шаг за шагом в вычислениях кратного изменения. Я в основном пытаюсь выяснить, что происходит для расчета коэффициентов. Из того, что я могу выяснить,...

15
Как сохранить переменные, не зависящие от времени, в модели с фиксированными эффектами

У меня есть данные о сотрудниках крупной итальянской фирмы за десять лет, и я хотел бы увидеть, как гендерный разрыв в заработках мужчин и женщин менялся с течением времени. Для этого я запускаю объединенные OLS: где - это логарифм за год, X_ {это} включает ковариаты, которые различаются по...

15
Случайная проблема с параметрами

Я всегда изо всех сил пытаюсь понять истинную суть проблемы случайных параметров. Я несколько раз читал, что оценки фиксированных эффектов нелинейных панельных моделей данных могут быть сильно смещены из-за «хорошо известной» проблемы побочных параметров. Когда я прошу дать четкое объяснение этой...

15
Почему я не могу сопоставить вывод glmer (family = binomial) с ручной реализацией алгоритма Гаусса-Ньютона?

Я хотел бы сравнить выходные данные lmer (действительно glmer) с примером игрушечного бинома. Я прочитал виньетки и, кажется, понимаю, что происходит. Но, видимо, я не. Застряв, я исправил «правду» в терминах случайных эффектов и пошел оценивать только фиксированные эффекты. Я включаю этот код...

15
Матричная запись для логистической регрессии

В линейной регрессии (квадрат потери), используя матрицу, мы получаем очень краткие обозначения для цели minimize  ∥Ax−b∥2minimize  ‖Ax−b‖2\text{minimize}~~ \|Ax-b\|^2 Где AAA - матрица данных, xxx - коэффициенты, а bbb - ответ. Существует ли аналогичная матричная запись для цели логистической...

15
Как подобрать смешанную модель с переменной отклика от 0 до 1?

Я пытаюсь использовать lme4::glmer()для подгонки биномиальной обобщенной смешанной модели (GLMM) с зависимой переменной, которая является не двоичной, а непрерывной переменной от нуля до единицы. Можно думать об этой переменной как о вероятности; на самом деле это вероятность того, как сообщили...

15
Какие варианты в модели пропорциональной регрессии рисков, когда остатки Шенфельда не хороши?

Я делаю пропорциональную регрессию рисков Кокса в R, используя coxphмножество переменных. Остатки Мартингейла выглядят великолепно, а остатки Шенфельда отлично подходят для ПОЧТИ всех переменных. Есть три переменные, чьи остатки Шенфельда не плоские, и природа переменных такова, что имеет смысл,...

15
Фиксированный эффект против случайного эффекта, когда все возможности включены в модель смешанных эффектов

В модели смешанных эффектов рекомендуется использовать фиксированный эффект для оценки параметра, если включены все возможные уровни (например, как мужчины, так и женщины). Кроме того, рекомендуется использовать случайный эффект для учета переменной, если включенные уровни представляют собой просто...

15
Визуализация результатов смешанной модели

Одна из проблем, с которыми я всегда сталкивался при работе со смешанными моделями, это выяснение визуализаций данных - таких, которые могут оказаться на бумаге или плакате, - как только кто-то получит результаты. Сейчас я работаю над моделью смешанных эффектов Пуассона с формулой, которая выглядит...

15
Может ли модель для неотрицательных данных со сгущением в нули (Tweedie GLM, нулевое раздувание GLM и т. Д.) Предсказать точные нули?

Распределение Твиди может моделировать искаженные данные с точечной массой в нуле, когда параметр (показатель степени в отношении средней дисперсии) находится между 1 и 2.pпp Точно так же модель с нулевой раздувкой (будь то непрерывная или дискретная) может иметь большое количество нулей. У меня...

15
Определение ковариационной структуры: плюсы и минусы

Каковы преимущества указания ковариационной структуры в GLM (вместо того, чтобы рассматривать все недиагональные элементы в ковариационной матрице как ноль)? Помимо отражения того, что каждый знает о данных, делает это улучшить качество посадки? повысить точность прогнозирования на удерживаемых...