У меня есть набор из 20 переменных, которые я проанализировал с помощью факторного анализа в SPSS. Для целей исследования мне необходимо разработать 6 факторов. SPSS показал, что 8 переменных (из 20) были загружены с низким весом или были загружены одинаково по нескольким факторам, поэтому я удалил их. Оставшиеся 12 переменных были загружены парами по 2 в 6 факторах, что является идеальной структурой - как я и хотел, но теперь один из профессоров, работающих со мной, хочет, чтобы я нашел оправдание, почему (или при каких условиях) это целесообразно хранить только 2 элемента на фактор, так как общеизвестно, что факторный анализ полезен с результатами загрузки 3 или более элементов на фактор.
Может кто-нибудь помочь мне с этим вопросом, желательно с опубликованной ссылкой?
Ответы:
Два или три элемента на фактор - это вопрос идентификации вашей модели CFA (подтверждающая ФА).
Для простоты предположим, что модель идентифицируется путем установки дисперсии каждого фактора равной 1. Предположим также, что нет коррелированных ошибок измерения.
Однофакторная модель с двумя элементами имеет две нагрузки и две дисперсии ошибок для оценки = 4 параметра, но в матрице дисперсии-ковариации есть только 3 нетривиальных записи, поэтому у вас недостаточно информации для оценки четырех параметров что тебе нужно.
Однофакторная модель с тремя элементами имеет три загрузки и три ошибки. Матрица дисперсии-ковариации имеет шесть записей, и тщательный аналитический анализ показывает, что модель точно идентифицирована, и вы можете алгебраически выразить оценки параметров как функции записей матрицы дисперсии-ковариации. С большим количеством элементов на один фактор у вас есть переопределенная модель (больше степеней свободы, чем у параметров), что обычно означает, что вы готовы к работе.
С более чем одним фактором, модель CFA всегда идентифицируется с 3+ элементами для каждого фактора (потому что простая модель измерения идентифицируется для каждого фактора, так что, грубо говоря, вы можете получить прогнозы для каждого фактора и оценить их ковариации на основе этого). Тем не менее, CFA с двумя элементами на фактор определяется при условии, что каждый фактор имеет ненулевую ковариацию по крайней мере с одним другим фактором в популяции. (В противном случае рассматриваемый фактор выпадает из системы, а однофакторная модель из двух элементов не идентифицируется.) Доказательство идентификации носит довольно технический характер и требует хорошего понимания алгебры матриц.
Боллен (1989) полностью и тщательно обсуждает вопросы идентификации моделей CFA в главе 7. См. С. 244, особенно в отношении правил с тремя и двумя показателями.
источник
Я никогда не слышал о критерии «3 предмета на фактор». Я бы перевернул вопрос и попросил вашего профессора придумать надежную ссылку на это утверждение.
Кроме того, «для целей исследования мне нужно разработать 6 факторов». странная вещь, чтобы сказать.
Основная цель факторного анализа: 1) выяснить, сколько факторов (часто психологических признаков) лежат в основе (большего) количества измеряемых переменных. Затем 2), основываясь на факторных нагрузках, мы пытаемся описать, каковы эти факторы на самом деле.
Вы не «развиваете» 6 факторов, вы «пытаетесь измерить» 6 факторов.
Однако наличие перекрестных нагрузок (переменных, нагруженных несколькими факторами) часто является показателем того, что факторы «пытаются коррелировать» друг с другом. Это имеет смысл, поскольку мы знаем, что в основном все соотносится со всем в реальном мире. Реализация этого наблюдения в вашем анализе с использованием наклонного (вместо ортогонального варимакс) вращения часто избавляет от многих поперечных нагрузок. ИМХО, теоретически это тоже более звучит.
Дайте этому шанс, у вас может получиться больше предметов на фактор. Это может (частично) решить и вашу проблему.
источник
factors are "trying to correlate" with each other
это мистическая формулировка. Факторы коррелируют или не коррелируют в зависимости от того, как мы их вращаем (моделируем). Довольно высокие «перекрестные нагрузки» возможны с ортогональными факторами с высокой общностью переменной.У меня сейчас такая же проблема. Вот статья, которая рекомендует использовать как минимум 3 элемента на фактор. В исключительных случаях, однако, вы можете использовать количество элементов на фактор (стр. 60). http://www.sajip.co.za/index.php/sajip/article/download/168/165 Мой случай кажется исключительным, поскольку в моем сетевом эксперименте есть только две переменные, которые предоставляют информацию об игроке стратегия и стратегия власти. Может быть, это также может помочь вам узаконить использование 2 предметов для некоторых факторов.
источник