Я понимаю, что анализ главных компонентов (PCA) может применяться в основном для данных поперечного сечения. Можно ли эффективно использовать PCA для данных временных рядов, указав год в качестве переменной временного ряда и нормально запустить PCA? Я обнаружил, что динамический PCA работает для данных панели, а кодирование в Stata предназначено для данных панели, а не для временных рядов. Существует ли какой-либо конкретный тип PCA, который работает с данными временных рядов?
Обновить. Позвольте мне объяснить подробно.
В настоящее время я строю индекс инфраструктуры в Индии с такими переменными, как длина дороги, длина железнодорожного маршрута, мощность выработки электроэнергии, количество абонентов телефонной связи и т. Д. У меня 12 переменных на 22 года для одной страны. Хотя я рассмотрел статьи, в которых применяется PCA к временным рядам и даже к групповым данным, PCA предназначен для данных поперечного сечения, которые предполагают наличие предположений. Данные панели и поперечного сечения нарушают их, и PCA не учитывает измерение временных рядов в них. Я видел динамический PCA, применяемый только к данным панели. Я хочу знать, будет ли работать конкретный PCA, который применяется к временным рядам или работает статический PCA с годом, определенным как переменная временного ряда?
источник
Ответы:
Один из подходов может заключаться в том, чтобы в первый раз использовать временные различия ваших 12 переменных для обеспечения стационарности. Затем рассчитайте ковариационную матрицу и проведите PCA на ней. Это будет своего рода средний PCA за весь промежуток времени, и он ничего не скажет о том, как различные временные лаги влияют друг на друга. Но это может быть хорошей отправной точкой.12×12
Если вы заинтересованы в разложении временной области, я бы проверил SSA, как это предлагается в комментариях.
Когда ряды (предположительно) являются стационарными, имеет смысл использовать одну ковариационную матрицу. Если ваши данные интегрированы порядка 1 или выше, как я подозреваю, это может быть, оценка одной ковариационной матрицы не даст последовательных результатов. Случайное блуждание, например, интегрировано с порядком 1, и предполагаемая ковариация двух случайных блужданий ничего не говорит об их совместном движении, здесь необходим анализ совместной интеграции .
Как предлагается в комментариях, PCA сам по себе не заботится о стационарности, поэтому вы можете кормить PCA любой положительной полуопределенной матрицей, и разложение PC будет в порядке в смысле PCA.
Но если ваша предполагаемая ковариационная матрица не представляет ничего значащего в данных, то PCA, конечно, тоже не будет.
источник
Да, PCA на временных рядах выполняется все время в финансовой инженерии (количественные финансы) и неврологии.
В неврологии PCA выполняется на временных рядах для потенциалов действия в различных диапазонах длин волн, полученных из ЭЭГ. Преобразование потенциалов действия в ортогональные (некоррелированные) оценочные векторы ПК и ввод ПК в другие анализы является основным средством, с помощью которого статистическая мощность была увеличена в статистическом генетическом моделировании сложных признаков поведенческой генетики (поскольку фенотипы, например, биполярные, новизна- ищущий, шизотипный, шозефрения часто пересекается). Большие австралийские исследования генетических близнецов сыграли важную роль в анализе этих частично совпадающих черт в поведенческой генетике, потому что, если существуют различия в заболеваниях среди идентичных близнецов, которые воспитываются вместе (растут в одном домохозяйстве), причинно-следственная связь может указывать на воздействие в разных средах, когда они были старше, чем их идентичная генетика.
источник