Вопросы с тегом «panel-data»

Данные панели относятся к многомерным данным, часто включающим измерения во времени в эконометрике. Это также называют продольными данными в биостатистике.

33
Стандартная кластеризация ошибок в R (вручную или в plm)

Я пытаюсь понять стандартную ошибку «кластеризация» и как выполнить в R (это тривиально в Stata). В РИ были неудачные попытки использования либо plmнаписания моей собственной функции. Я буду использовать diamondsданные из ggplot2пакета. Я могу сделать фиксированные эффекты с помощью фиктивных...

28
Как интерпретировать дисперсию и корреляцию случайных эффектов в модели смешанных эффектов?

Я надеюсь, что вы все не возражаете против этого вопроса, но мне нужна помощь в интерпретации выходных данных для выходных данных модели линейных смешанных эффектов, которые я пытался научиться делать в R. Я новичок в продольном анализе данных и регрессии линейных смешанных эффектов. У меня есть...

27
Могут ли степени свободы быть нецелым числом?

Когда я использую GAM, он дает мне остаточный DF, (последняя строка в коде). Что это значит? Выходя за рамки примера GAM, в общем, может ли число степеней свободы быть нецелым числом?26,626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data =...

25
Каково допустимое значение критерия Калинского и Харабаса (СН)?

Я провел анализ данных, пытаясь сгруппировать продольные данные, используя R и пакет kml . Мои данные содержат около 400 отдельных траекторий (как это называется в статье). Вы можете увидеть мои результаты на следующем рисунке: После прочтения главы 2.2 «Выбор оптимального числа кластеров» в...

21
Как спроецировать новый вектор на пространство PCA?

После выполнения анализа главных компонентов (PCA) я хочу спроецировать новый вектор на пространство PCA (т.е. найти его координаты в системе координат PCA). Я рассчитал PCA на языке R, используя prcomp. Теперь я должен быть в состоянии умножить свой вектор на матрицу вращения PCA. Должны ли...

20
Указание модели разницы в различиях с несколькими периодами времени

Когда я оцениваю модель разности различий с двумя периодами времени, эквивалентная модель регрессии а. Yist=α+γs∗Treatment+λdt+δ∗(Treatment∗dt)+ϵistYist=α+γs∗Treatment+λdt+δ∗(Treatment∗dt)+ϵistY_{ist} = \alpha +\gamma_s*Treatment + \lambda d_t + \delta*(Treatment*d_t)+ \epsilon_{ist} где...

20
Можно ли использовать сплайны для прогнозирования?

Я не могу точно сказать о характере данных, поскольку они являются собственностью, но предположим, что у нас есть такие данные: каждый месяц некоторые люди подписываются на услугу. Затем в каждом последующем месяце эти люди могут обновить услугу, прекратить обслуживание или получить отказ в...

17
Сохраняются ли автокоррелированные остаточные структуры даже в моделях с соответствующими структурами корреляции и как выбрать лучшие модели?

контекст В этом вопросе используется R, но речь идет об общих статистических вопросах. Я анализирую влияние факторов смертности (% смертности от болезней и паразитов) на скорость роста популяции моли с течением времени, когда популяция личинок отбиралась из 12 мест один раз в год в течение 8 лет....

17
Каковы различия между терминами «анализ временных рядов» и «анализ продольных данных»

Говоря о продольных данных, мы можем многократно ссылаться на данные, собранные с течением времени от одного и того же субъекта / единицы исследования, таким образом, существуют корреляции для наблюдений внутри одного и того же субъекта, т. Е. Сходство внутри объекта. Говоря о данных временного...

16
Как анализировать данные продольного счета: учет временной автокорреляции в GLMM?

Здравствуйте, статистические гуру и мастера программирования R, Я заинтересован в моделировании захвата животных в зависимости от условий окружающей среды и дня года. Как часть другого исследования, у меня есть подсчеты по ~ 160 дней за три года. В каждый из этих дней у меня есть температура,...

15
Каковы различия между «Моделированием смешанных эффектов» и «Моделированием скрытого роста»?

Я неплохо знаком с моделями смешанных эффектов (MEM), но недавно один из коллег спросил меня, как они соотносятся с моделями скрытого роста (LGM). Я немного погуглил, и кажется, что LGM - это вариант моделирования структурных уравнений, который применяется к обстоятельствам, когда повторяющиеся...

15
Какова интуиция за сменными образцами при нулевой гипотезе?

Тесты перестановки (также называемые тестом рандомизации, тестом повторной рандомизации или точным тестом) очень полезны и оказываются полезными, когда предположение о нормальном распределении, требуемое, например, t-testне выполняется, и когда преобразование значений путем ранжирования...

15
Точность градиентной машины уменьшается с увеличением числа итераций

Я экспериментирую с алгоритмом машины повышения градиента через caretпакет в R. Используя небольшой набор данных для поступления в колледж, я запустил следующий код: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create...

14
Когда необходимо включать отставание зависимой переменной в регрессионную модель и какое отставание?

Данные, которые мы хотим использовать в качестве зависимой переменной, выглядят следующим образом (это данные подсчета). Мы опасаемся, что, поскольку он имеет циклический компонент и структуру тренда, регрессия оказывается как-то предвзятой. Мы будем использовать отрицательную биномиальную...

14
В чем разница между эконометрикой временных рядов и эконометрикой панельных данных?

Этот вопрос может быть очень наивным, но то, как меня учат эконометрике, меня очень смущает, если есть разница между временными рядами и методом панельных данных. Что касается временных рядов, я рассмотрел такие темы, как стационарная ковариация, AR, MA и т. Д. Что касается данных панели, я видел...

14
Разница между данными панели и смешанной моделью

Я хотел бы знать разницу между групповым анализом данных и анализом смешанных моделей. Насколько мне известно, как данные панели, так и смешанные модели используют фиксированные и случайные эффекты. Если так, почему у них разные имена? Или они синонимы? Я прочитал следующий пост, который описывает...

14
Как моделировать большие продольные данные?

Традиционно мы используем смешанную модель для моделирования продольных данных, то есть таких данных, как: id obs age treatment_lvl yield 1 0 11 M 0.2 1 1 11.5 M 0.5 1 2 12 L 0.6 2 0 17 H 1.2 2 1 18 M 0.9 мы можем предположить случайный перехват или наклон для разных людей. Однако вопрос, который я...

14
Пакет R для логистической регрессии с фиксированным эффектом

Я ищу Rпакет для оценки коэффициентов логит-моделей с индивидуальным фиксированным эффектом (индивидуальный перехват) с использованием оценки Чемберлена 1980 года. Это часто называют оценкой логита Чемберлена с фиксированным эффектом. Это классическая оценка при работе с бинарными данными панели...

13
В чем разница между использованием aov () и lme () при анализе продольного набора данных?

Может кто-нибудь сказать мне разницу между использованием aov()и lme()для анализа продольных данных и как интерпретировать результаты этих двух методов? Ниже я анализирую один и тот же набор данных aov()и получаю lme()2 разных результата. Таким образом aov(), я получил значительный результат во...