Вопросы с тегом «stata»

12

Применяется ли процедура фиксированных эффектов Мундлака для логистической регрессии с использованием макетов?

У меня есть набор данных с 8000 кластеров и 4 миллиона наблюдений. К сожалению, мое статистическое программное обеспечение, Stata, работает довольно медленно при использовании функции панельных данных для логистической регрессии: xtlogitдаже с 10% -ной выборкой. Однако при использовании непанельной...

12

Присвоить веса переменным в кластерном анализе

Я хочу назначить разные веса переменным в моем кластерном анализе, но моя программа (Stata), похоже, не имеет возможности для этого, поэтому мне нужно сделать это вручную. Представьте себе 4 переменные A, B, C, D. Веса для этих переменных должны быть w(A)=50% w(B)=25% w(C)=10% w(D)=15% Мне...

clustering stata

11

Как сравнить 2 нестационарных временных ряда, чтобы определить корреляцию?

У меня есть два ряда данных, которые показывают средний возраст смерти с течением времени. Обе серии демонстрируют повышенный возраст на момент смерти, но один значительно ниже другого. Я хочу определить, значительно ли увеличение возраста на момент смерти у нижней выборки, чем у верхней выборки....

time-series correlation stata

11

Метрика оценки прогноза для панельных / продольных данных

Я хотел бы оценить несколько различных моделей, которые обеспечивают предсказания поведения на ежемесячном уровне. Данные сбалансированы, и 100 000 и T = 12. В результате посещение концерта происходит в определенном месяце, поэтому оно равно нулю для ~ 80% людей в любом месяце, но есть длинный...

repeated-measures predictive-models stata panel-data validation

11

Должен ли я проводить отдельные регрессии для каждого сообщества или сообщество может быть просто управляющей переменной в агрегированной модели?

Я использую модель OLS с непрерывной переменной индекса ресурса в качестве DV. Мои данные собраны из трех аналогичных сообществ в географической близости друг к другу. Несмотря на это, я подумал, что важно использовать сообщество в качестве управляющей переменной. Как оказалось, сообщество значимо...

regression categorical-data stata multiple-regression aggregation

10

Должен ли я загружаться на уровне кластера или на индивидуальном уровне?

У меня есть модель выживания с пациентами, размещенными в больницах, которая включает случайный эффект для больниц. Случайный эффект имеет гамма-распределение, и я пытаюсь сообщить о «значимости» этого термина в легко понятной шкале. Я нашел следующие ссылки, в которых используется Медианное...

stata bootstrap multilevel-analysis resampling frailty

10

Сравнение пропорций с двумя выборками, оценка размера выборки: R против Stata

Сравнение пропорций с двумя выборками, оценка размера выборки: R против Stata Я получил разные результаты для размеров выборки, а именно: В R power.prop.test(p1 = 0.70, p2 = 0.85, power = 0.90, sig.level = 0.05) Результат: (т. 161) для каждой группы.n = 160,7777Nзнак равно160.7777n = 160.7777 В...

r stata sample-size power-analysis jmp

10

Как бороться с опущенными фиктивными переменными в модели с фиксированным эффектом?

Я использую модель с фиксированным эффектом для своих данных панели (9 лет, 1000+ наблюдений), поскольку мой тест Хаусмана показывает значение . Когда я добавляю фиктивные переменные для отраслей, которые включили мои фирмы, они всегда опускаются. Я знаю, что между различными отраслевыми группами...

stata panel-data fixed-effects-model hausman

10

Как мне включить инновационный выброс при наблюдении 48 в мою модель ARIMA?

Я работаю над набором данных. После использования некоторых методов идентификации моделей я разработал модель ARIMA (0,2,1). Я использовал detectIOфункцию в пакете TSAв R, чтобы обнаружить инновационный выброс (IO) на 48-м наблюдении за моим исходным набором данных. Как включить этот выброс в мою...

r time-series arima outliers hypergeometric fishers-exact r time-series intraclass-correlation r logistic glmm clogit mixed-model spss repeated-measures ancova machine-learning python scikit-learn distributions data-transformation stochastic-processes web standard-deviation r machine-learning spatial similarities spatio-temporal binomial sparse poisson-process r regression nonparametric r regression logistic simulation power-analysis r svm random-forest anova repeated-measures manova regression statistical-significance cross-validation group-differences model-comparison r spatial model-evaluation parallel-computing generalized-least-squares r stata fitting mixture hypothesis-testing categorical-data hypothesis-testing anova statistical-significance repeated-measures likert wilcoxon-mann-whitney boxplot statistical-significance confidence-interval forecasting prediction-interval regression categorical-data stata least-squares experiment-design skewness reliability cronbachs-alpha r regression splines maximum-likelihood modeling likelihood-ratio profile-likelihood nested-models

10

Различия в определении куртоза и их интерпретация

Недавно я понял, что существуют различия в значениях эксцесса, предоставляемых SPSS и Stata. См. Http://www.ats.ucla.edu/stat/mult_pkg/faq/general/kurtosis.htm. Насколько я понимаю, интерпретация одного и того же будет другой. Любой совет, как с этим бороться?...

spss stata interpretation kurtosis

10

Модель истории дискретного времени (выживания) в R

Я пытаюсь вписать модель с дискретным временем в R, но я не уверен, как это сделать. Я читал, что вы можете организовать зависимую переменную в разных строках, по одной для каждого временного наблюдения, и использовать glmфункцию со ссылкой logit или cloglog. В этом смысле, у меня есть три колонки:...

r survival pca sas matlab neural-networks r logistic spatial spatial-interaction-model r time-series econometrics var statistical-significance t-test cross-validation sample-size r regression optimization least-squares constrained-regression nonparametric ordinal-data wilcoxon-signed-rank references neural-networks jags bugs hierarchical-bayesian gaussian-mixture r regression svm predictive-models libsvm scikit-learn probability self-study stata sample-size spss wilcoxon-mann-whitney survey ordinal-data likert group-differences r regression anova mathematical-statistics normal-distribution random-generation truncation repeated-measures variance variability distributions random-generation uniform regression r generalized-linear-model goodness-of-fit data-visualization r time-series arima autoregressive confidence-interval r time-series arima autocorrelation seasonality hypothesis-testing bayesian frequentist uninformative-prior correlation matlab cross-correlation

10

Графики в регрессионном разрыве дизайна в «Stata» или «R»

Lee и Lemieux (стр. 31, 2009) предлагают исследователю представить графики при выполнении анализа разрыва непрерывности регрессии (RDD). Они предлагают следующую процедуру: «... для некоторой полосы пропускания и для некоторого числа бинов и слева и справа от значения отсечки, соответственно, идея...

r regression data-visualization stata regression-discontinuity

10

Почему Anova () и drop1 () предоставили разные ответы для GLMM?

У меня есть GLMM формы: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Когда я использую drop1(model, test="Chi"), я получаю другие результаты, чем если бы я использовал Anova(model, type="III")из пакета автомобиля или summary(model). Последние...

r anova glmm r mixed-model bootstrap sample-size cross-validation roc auc sampling stratification random-allocation logistic stata interpretation proportion r regression multiple-regression linear-model lm r cross-validation cart rpart logistic generalized-linear-model econometrics experiment-design causality instrumental-variables random-allocation predictive-models data-mining estimation contingency-tables epidemiology standard-deviation mean ancova psychology statistical-significance cross-validation synthetic-data poisson-distribution negative-binomial bioinformatics sequence-analysis distributions binomial classification k-means distance unsupervised-learning euclidean correlation chi-squared spearman-rho forecasting excel exponential-smoothing binomial sample-size r change-point wilcoxon-signed-rank ranks clustering matlab covariance covariance-matrix normal-distribution simulation random-generation bivariate standardization confounding z-statistic forecasting arima minitab poisson-distribution negative-binomial poisson-regression overdispersion probability self-study markov-process estimation maximum-likelihood classification pca group-differences chi-squared survival missing-data contingency-tables anova proportion

10

R эквивалентно опции кластера при использовании отрицательной биномиальной регрессии

Я пытаюсь повторить работу коллеги и перемещаю анализ из Stata в R. Модели, которые она использует, вызывают параметр «cluster» в функции nbreg для кластеризации стандартных ошибок. См. Http://repec.org/usug2007/crse.pdf для довольно полного описания того, что и почему этого параметра Мой вопрос:...

r stata negative-binomial

9

Использование алгоритма EM для связывания записей

Мне интересно связать записи между двумя наборами данных по имени, фамилии и году рождения. Можно ли это сделать с помощью алгоритма EM, и если да, то как? В качестве примера рассмотрим следующую запись в 1-м: Карл Маккарти, 1967. Я буду искать по всем записям во втором наборе данных и назначать...

machine-learning stata expectation-maximization record-linkage perl

9

Как сравнить наблюдаемые и ожидаемые события?

Предположим, у меня есть одна выборка частот из 4 возможных событий: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 и у меня есть ожидаемые вероятности того, что мои события произойдут: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 С суммой наблюдаемых частот моих четырех событий (18) я могу рассчитать ожидаемые частоты...

r statistical-significance chi-squared multivariate-analysis exponential joint-distribution statistical-significance self-study standard-deviation probability normal-distribution spss interpretation assumptions cox-model reporting cox-model statistical-significance reliability method-comparison classification boosting ensemble adaboost confidence-interval cross-validation prediction prediction-interval regression machine-learning svm regularization regression sampling survey probit matlab feature-selection information-theory mutual-information time-series forecasting simulation classification boosting ensemble adaboost normal-distribution multivariate-analysis covariance gini clustering text-mining distance-functions information-retrieval similarities regression logistic stata group-differences r anova confidence-interval repeated-measures r logistic lme4-nlme inference fiducial kalman-filter classification discriminant-analysis linear-algebra computing statistical-significance time-series panel-data missing-data uncertainty probability multivariate-analysis r classification spss k-means discriminant-analysis poisson-distribution average r random-forest importance probability conditional-probability distributions standard-deviation time-series machine-learning online forecasting r pca dataset data-visualization bayes distributions mathematical-statistics degrees-of-freedom

9

Схемы альтернативного взвешивания для мета-анализа случайных эффектов: отсутствуют стандартные отклонения

Я работаю над метаанализом случайных эффектов, охватывающим ряд исследований, в которых не сообщается о стандартных отклонениях; все исследования указывают размер выборки. Я не верю, что можно приблизить или приписать отсутствующие данные SD. Как метаанализ, который использует сырые (нестандартные)...

stata missing-data meta-analysis meta-regression

9

Парные, повторные измерения ANOVA или смешанная модель?

Меня попросили проанализировать некоторые данные клинического испытания, изучив два метода измерения артериального давления. У меня есть данные от 50 субъектов, каждый из которых использует от 2 до 57 измерений, используя каждый метод. Мне интересно, как лучше поступить. Очевидно, что мне нужно...

r anova mixed-model stata

9

Ресурсы для изучения Stata

Я знаю о микроэконометрике Кэмерона и Триведи с использованием Stata. Какие еще хорошие тексты для изучения Stata?

references stata