Вопросы с тегом «stata»

12
Применяется ли процедура фиксированных эффектов Мундлака для логистической регрессии с использованием макетов?

У меня есть набор данных с 8000 кластеров и 4 миллиона наблюдений. К сожалению, мое статистическое программное обеспечение, Stata, работает довольно медленно при использовании функции панельных данных для логистической регрессии: xtlogitдаже с 10% -ной выборкой. Однако при использовании непанельной...

12
Присвоить веса переменным в кластерном анализе

Я хочу назначить разные веса переменным в моем кластерном анализе, но моя программа (Stata), похоже, не имеет возможности для этого, поэтому мне нужно сделать это вручную. Представьте себе 4 переменные A, B, C, D. Веса для этих переменных должны быть w(A)=50% w(B)=25% w(C)=10% w(D)=15% Мне...

11
Как сравнить 2 нестационарных временных ряда, чтобы определить корреляцию?

У меня есть два ряда данных, которые показывают средний возраст смерти с течением времени. Обе серии демонстрируют повышенный возраст на момент смерти, но один значительно ниже другого. Я хочу определить, значительно ли увеличение возраста на момент смерти у нижней выборки, чем у верхней выборки....

11
Метрика оценки прогноза для панельных / продольных данных

Я хотел бы оценить несколько различных моделей, которые обеспечивают предсказания поведения на ежемесячном уровне. Данные сбалансированы, и 100 000 и T = 12. В результате посещение концерта происходит в определенном месяце, поэтому оно равно нулю для ~ 80% людей в любом месяце, но есть длинный...

11
Должен ли я проводить отдельные регрессии для каждого сообщества или сообщество может быть просто управляющей переменной в агрегированной модели?

Я использую модель OLS с непрерывной переменной индекса ресурса в качестве DV. Мои данные собраны из трех аналогичных сообществ в географической близости друг к другу. Несмотря на это, я подумал, что важно использовать сообщество в качестве управляющей переменной. Как оказалось, сообщество значимо...

10
Должен ли я загружаться на уровне кластера или на индивидуальном уровне?

У меня есть модель выживания с пациентами, размещенными в больницах, которая включает случайный эффект для больниц. Случайный эффект имеет гамма-распределение, и я пытаюсь сообщить о «значимости» этого термина в легко понятной шкале. Я нашел следующие ссылки, в которых используется Медианное...

10
Сравнение пропорций с двумя выборками, оценка размера выборки: R против Stata

Сравнение пропорций с двумя выборками, оценка размера выборки: R против Stata Я получил разные результаты для размеров выборки, а именно: В R power.prop.test(p1 = 0.70, p2 = 0.85, power = 0.90, sig.level = 0.05) Результат: (т. 161) для каждой группы.n = 160,7777Nзнак равно160.7777n = 160.7777 В...

10
Как бороться с опущенными фиктивными переменными в модели с фиксированным эффектом?

Я использую модель с фиксированным эффектом для своих данных панели (9 лет, 1000+ наблюдений), поскольку мой тест Хаусмана показывает значение . Когда я добавляю фиктивные переменные для отраслей, которые включили мои фирмы, они всегда опускаются. Я знаю, что между различными отраслевыми группами...

10
Как мне включить инновационный выброс при наблюдении 48 в мою модель ARIMA?

Я работаю над набором данных. После использования некоторых методов идентификации моделей я разработал модель ARIMA (0,2,1). Я использовал detectIOфункцию в пакете TSAв R, чтобы обнаружить инновационный выброс (IO) на 48-м наблюдении за моим исходным набором данных. Как включить этот выброс в мою...

10
Различия в определении куртоза и их интерпретация

Недавно я понял, что существуют различия в значениях эксцесса, предоставляемых SPSS и Stata. См. Http://www.ats.ucla.edu/stat/mult_pkg/faq/general/kurtosis.htm. Насколько я понимаю, интерпретация одного и того же будет другой. Любой совет, как с этим бороться?...

10
Модель истории дискретного времени (выживания) в R

Я пытаюсь вписать модель с дискретным временем в R, но я не уверен, как это сделать. Я читал, что вы можете организовать зависимую переменную в разных строках, по одной для каждого временного наблюдения, и использовать glmфункцию со ссылкой logit или cloglog. В этом смысле, у меня есть три колонки:...

10
Графики в регрессионном разрыве дизайна в «Stata» или «R»

Lee и Lemieux (стр. 31, 2009) предлагают исследователю представить графики при выполнении анализа разрыва непрерывности регрессии (RDD). Они предлагают следующую процедуру: «... для некоторой полосы пропускания и для некоторого числа бинов и слева и справа от значения отсечки, соответственно, идея...

10
Почему Anova () и drop1 () предоставили разные ответы для GLMM?

У меня есть GLMM формы: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Когда я использую drop1(model, test="Chi"), я получаю другие результаты, чем если бы я использовал Anova(model, type="III")из пакета автомобиля или summary(model). Последние...

10
R эквивалентно опции кластера при использовании отрицательной биномиальной регрессии

Я пытаюсь повторить работу коллеги и перемещаю анализ из Stata в R. Модели, которые она использует, вызывают параметр «cluster» в функции nbreg для кластеризации стандартных ошибок. См. Http://repec.org/usug2007/crse.pdf для довольно полного описания того, что и почему этого параметра Мой вопрос:...

9
Использование алгоритма EM для связывания записей

Мне интересно связать записи между двумя наборами данных по имени, фамилии и году рождения. Можно ли это сделать с помощью алгоритма EM, и если да, то как? В качестве примера рассмотрим следующую запись в 1-м: Карл Маккарти, 1967. Я буду искать по всем записям во втором наборе данных и назначать...

9
Как сравнить наблюдаемые и ожидаемые события?

Предположим, у меня есть одна выборка частот из 4 возможных событий: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 и у меня есть ожидаемые вероятности того, что мои события произойдут: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 С суммой наблюдаемых частот моих четырех событий (18) я могу рассчитать ожидаемые частоты...

9
Схемы альтернативного взвешивания для мета-анализа случайных эффектов: отсутствуют стандартные отклонения

Я работаю над метаанализом случайных эффектов, охватывающим ряд исследований, в которых не сообщается о стандартных отклонениях; все исследования указывают размер выборки. Я не верю, что можно приблизить или приписать отсутствующие данные SD. Как метаанализ, который использует сырые (нестандартные)...

9
Парные, повторные измерения ANOVA или смешанная модель?

Меня попросили проанализировать некоторые данные клинического испытания, изучив два метода измерения артериального давления. У меня есть данные от 50 субъектов, каждый из которых использует от 2 до 57 измерений, используя каждый метод. Мне интересно, как лучше поступить. Очевидно, что мне нужно...