Вопросы с тегом «model»

12
Когда фиксированный эффект действительно фиксирован?

Рассмотрим линейную модель ненаблюдаемых эффектов типа: где - ненаблюдаемая, но не зависящая от времени характеристика, а - ошибка, и индекс отдельных наблюдений и времени соответственно. Типичный подход в регрессии с фиксированными эффектами (FE) будет состоять в том, чтобы удалить помощью...

12
Критерии выбора «лучшей» модели в скрытой марковской модели

У меня есть набор данных временного ряда, к которому я пытаюсь подогнать скрытую марковскую модель (HMM), чтобы оценить количество скрытых состояний в данных. Мой псевдокод для этого следующий: for( i in 2 : max_number_of_states ){ ... calculate HMM with i states ... optimal_number_of_states =...

12
Смешанная модель с 1 наблюдением за уровень

Я подгоняю модель случайных эффектов glmerк некоторым бизнес-данным. Цель состоит в том, чтобы проанализировать показатели продаж по дистрибьюторам с учетом региональных различий. У меня есть следующие переменные: distcode: идентификатор дистрибьютора, около 800 уровней region: географический...

12
Путаница с lmer и p-значениями: как p-значения из пакета memisc сравниваются с MCMC?

У меня сложилось впечатление, что функция lmer()в lme4пакете не производит p-значения (см. lmerP-значения и все такое ). Я использую MCMC сгенерированных значений р вместо как на этот вопрос: Значительный эффект в lme4смешанной модели и на этот вопрос: Не удается найти р-значения в выводе из...

12
Вывод о фиксированных эффектах в модели смешанных эффектов

Я сопоставил данные и использую модель смешанных эффектов логистической регрессии для оценки индивидуального уровня (условного) эффекта для предиктора интереса. Я знаю, что для стандартных маржинальных моделей логический вывод параметров модели с использованием теста Вальда согласуется с критериями...

12
Есть ли проблема с мультиколлинеарностью и регрессией сплайнов?

При использовании естественных (то есть ограниченных) кубических сплайнов созданные базовые функции являются в высокой степени коллинеарными, и при использовании в регрессии, по-видимому, они дают очень высокую статистику VIF (дисперсионный коэффициент инфляции), сигнализируя о...

12
Почему F-тест в гауссовых линейных моделях является наиболее мощным?

Y=μ+σGY=μ+σGY=\mu+\sigma Gμμ\muWWWGGGRnRn\mathbb{R}^nFFFH0:{μ∈U}H0:{μ∈U}H_0\colon\{\mu \in U\}U⊂WU⊂WU \subset Wf=ϕ(2logsupμ∈W,σ>0L(μ,σ|y)supμ∈U,σ>0L(μ,σ|y)).f=ϕ(2log⁡supμ∈W,σ>0L(μ,σ|y)supμ∈U,σ>0L(μ,σ|y)).f=\phi\left( 2\log \frac{\sup_{\mu \in W, \sigma>0} L(\mu, \sigma | y)}{\sup_{\mu...

12
Точный критерий Фишера и гипергеометрическое распределение

Я хотел лучше понять точный критерий Фишера, поэтому я разработал следующий пример игрушки, где f и m соответствуют мужской и женской части, а n и y соответствуют «потреблению соды», например: > soda_gender f m n 0 5 y 5 0 Очевидно, это резкое упрощение, но я не хотел, чтобы контекст мешал....

12
Рассчитать логарифмическое правдоподобие «вручную» для обобщенной нелинейной регрессии наименьших квадратов (nlme)

Я пытаюсь вычислить логарифмическую вероятность для обобщенной нелинейной регрессии наименьших квадратов для функции оптимизированной с помощью функция в пакете R , используя ковариационную матрицу дисперсии, генерируемую расстояниями на филогенетическом дереве, предполагающем броуновское движение...

12
Не можете найти подходящую модель для подсчета данных со смешанными эффектами - ZINB или что-то еще?

У меня есть очень маленький набор данных о численности одиночной пчелы, который мне трудно анализировать. Это данные подсчета, и почти все подсчеты находятся в одной обработке, а большинство нулей в другой обработке. Есть также пара очень высоких значений (по одному на двух из шести сайтов),...

12
Как я могу обучить HMM для классификации?

Итак, я понимаю, что когда вы готовите HMM для классификации, стандартный подход: Разделите ваши наборы данных на наборы данных для каждого класса Тренируйте один HMM в классе На тестовом наборе сравните вероятность каждой модели для классификации каждого окна Но как мне тренировать HMM в каждом...

12
Проверка невязок на нормальность в обобщенных линейных моделях

Эта статья использует обобщенные линейные модели (как биномиальное, так и отрицательное биномиальное распределение ошибок) для анализа данных. Но затем в разделе методов статистического анализа есть следующее утверждение: ... и, во-вторых, путем моделирования данных присутствия с использованием...

12
Отчетность о результатах линейной модели смешанных эффектов

Линейные модели со смешанными эффектами обычно не используются в моей области биологии, и мне нужно сообщить о статистическом тесте, который я использовал в статье, которую я пытаюсь написать. Я знаю, что осведомленность о многоуровневом моделировании начинает появляться в некоторых областях...

12
Как выполнить вменение значений в очень большом количестве точек данных?

У меня очень большой набор данных и около 5% случайных значений отсутствуют. Эти переменные связаны друг с другом. В следующем примере набор данных R - просто игрушечный пример с фиктивными коррелированными данными. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000,...

12
Можно ли оценить GLM в Python / scikit-learn, используя распределения Пуассона, Гаммы или Твиди как семейство для распределения ошибок?

Пытаюсь выучить немного Python и Sklearn, но для своей работы мне нужно запустить регрессии, которые используют распределения ошибок из семейств Пуассона, Гаммы и особенно семейства Твиди. Я ничего не вижу в документации о них, но они есть в нескольких частях дистрибутива R, поэтому мне было...

12
Почему SAS PROC GLIMMIX дает ОЧЕНЬ разные случайные уклоны, чем glmer (lme4) для биномиального glmm

Я - пользователь, более знакомый с R, и пытался оценить случайные уклоны (коэффициенты отбора) примерно для 35 особей в течение 5 лет для четырех переменных среды обитания. Переменная ответа - является ли место «использованным» (1) или «доступным» (0) местом обитания («использование» ниже). Я...

12
Логистическая регрессия со сплайнами регрессии в R

Я разрабатывал модель логистической регрессии на основе ретроспективных данных из национальной базы данных о травмах головы в Великобритании. Ключевым результатом является 30-дневная смертность (обозначается как «выживаемая» мера). Другие меры с опубликованным доказательством существенного влияния...

12
Потенциальная путаница в дизайне эксперимента

Обзор вопроса Предупреждение: этот вопрос требует много настроек. Пожалуйста, потерпите меня. Мой коллега и я работаем над проектом эксперимента. Дизайн должен работать с большим количеством ограничений, которые я перечислю ниже. Я разработал схему, которая удовлетворяет ограничениям и дает нам...