В общем, я стандартизирую свои независимые переменные в регрессиях, чтобы правильно сравнить коэффициенты (таким образом, они имеют одинаковые единицы: стандартные отклонения). Однако с панельными / продольными данными я не уверен, как мне следует стандартизировать мои данные, особенно если я оцениваю иерархическую модель.
Чтобы понять, почему это может быть потенциальной проблемой, предположим, что у вас есть особей, измеренных по периодам t = 1 , … , T, и вы измерили зависимую переменную, y i , t и одну независимую переменную x i , t , Если вы выполняете полную регрессию пула, тогда можно стандартизировать ваши данные следующим образом: x . z = ( x - среднее ( x ) ) / sd ( x , так как он не изменит t-статистику. С другой стороны, если вы подходите к нерегулярной регрессии, т. Е. По одной регрессии для каждого человека, то вам следует стандартизировать данные только по отдельным лицам, а не по всему набору данных (в коде R):
for (i in 1:n) {
for ( t in 1:T) x.z[i] = (x[i,t] - mean(x[i,]))/sd(x[i,])
}
Однако, если вы подходите к простой иерархической модели с различным перехватом по отдельным лицам, то вы используете оценку усадки, т. Е. Вы оцениваете модель между объединенной и не объединенной регрессией. Как мне стандартизировать мои данные? Используя все данные как объединенную регрессию? Использование только отдельных лиц, как в случае без пула?
источник
Существует альтернатива стандартизации для приведения переменных, измеренных в разных шкалах, к одной и той же метрике. Он называется «Пропорция максимального масштабирования» (POMS), и он не смешивается с многомерными распределениями, как это имеет место в z-преобразовании.
Тодд Литтл явно рекомендует POMS вместо z-стандартизации в своей книге по моделированию продольных структурных уравнений. Z-преобразование сопряжено с дополнительными проблемами при работе с продольными данными, см. Здесь: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4569815/
источник