Допустимо ли иметь только два (или менее) элемента (переменных), загруженных фактором факторного анализа?

10

У меня есть набор из 20 переменных, которые я проанализировал с помощью факторного анализа в SPSS. Для целей исследования мне необходимо разработать 6 факторов. SPSS показал, что 8 переменных (из 20) были загружены с низким весом или были загружены одинаково по нескольким факторам, поэтому я удалил их. Оставшиеся 12 переменных были загружены парами по 2 в 6 факторах, что является идеальной структурой - как я и хотел, но теперь один из профессоров, работающих со мной, хочет, чтобы я нашел оправдание, почему (или при каких условиях) это целесообразно хранить только 2 элемента на фактор, так как общеизвестно, что факторный анализ полезен с результатами загрузки 3 или более элементов на фактор.

Может кто-нибудь помочь мне с этим вопросом, желательно с опубликованной ссылкой?

Митя
источник
Допустим также один фактор элемента, если этот элемент имеет более высокий коэффициент загрузки.
Мира Ганг
«Минимум 3 элемента на фактор» - это гарантированная рекомендация. Если после поворота фактора у вас есть результаты с 2 или одним элементом в факторе, то либо 1) получите больше переменных, которые вы ожидаете загрузить этим фактором, либо 2) повторите анализ и извлеките меньше факторов, либо 3) оставьте результаты как есть, но не интерпретируют фактор «нуждаемости», говоря: «Я считаю, что этот фактор существует, но поскольку он в настоящее время недостаточно поддерживается элементами, я исключаю его из интерпретации и из результатов». Все эти 2 рекомендации разные.
ttnphns
См. Также, помимо ответов здесь, stats.stackexchange.com/a/198684/3277 (poit 5), почему «По крайней мере 3 загруженных элемента на фактор» является разумным требованием.
ttnphns

Ответы:

13

Два или три элемента на фактор - это вопрос идентификации вашей модели CFA (подтверждающая ФА).

Для простоты предположим, что модель идентифицируется путем установки дисперсии каждого фактора равной 1. Предположим также, что нет коррелированных ошибок измерения.

Однофакторная модель с двумя элементами имеет две нагрузки и две дисперсии ошибок для оценки = 4 параметра, но в матрице дисперсии-ковариации есть только 3 нетривиальных записи, поэтому у вас недостаточно информации для оценки четырех параметров что тебе нужно.

Однофакторная модель с тремя элементами имеет три загрузки и три ошибки. Матрица дисперсии-ковариации имеет шесть записей, и тщательный аналитический анализ показывает, что модель точно идентифицирована, и вы можете алгебраически выразить оценки параметров как функции записей матрицы дисперсии-ковариации. С большим количеством элементов на один фактор у вас есть переопределенная модель (больше степеней свободы, чем у параметров), что обычно означает, что вы готовы к работе.

С более чем одним фактором, модель CFA всегда идентифицируется с 3+ элементами для каждого фактора (потому что простая модель измерения идентифицируется для каждого фактора, так что, грубо говоря, вы можете получить прогнозы для каждого фактора и оценить их ковариации на основе этого). Тем не менее, CFA с двумя элементами на фактор определяется при условии, что каждый фактор имеет ненулевую ковариацию по крайней мере с одним другим фактором в популяции. (В противном случае рассматриваемый фактор выпадает из системы, а однофакторная модель из двух элементов не идентифицируется.) Доказательство идентификации носит довольно технический характер и требует хорошего понимания алгебры матриц.

Боллен (1989) полностью и тщательно обсуждает вопросы идентификации моделей CFA в главе 7. См. С. 244, особенно в отношении правил с тремя и двумя показателями.

Stask
источник
1
Это был очень удачный ответ. Я бы только прокомментировал (ради ФП), что ФП спросил о разведочной ФА (ОДВ). Логично, что EFA должен иметь «3+ загруженных элемента на фактор», поскольку CFA ожидает этого; только то, что вы не сказали об этом в своем ответе.
ttnphns
4

Я никогда не слышал о критерии «3 предмета на фактор». Я бы перевернул вопрос и попросил вашего профессора придумать надежную ссылку на это утверждение.

Кроме того, «для целей исследования мне нужно разработать 6 факторов». странная вещь, чтобы сказать.

Основная цель факторного анализа: 1) выяснить, сколько факторов (часто психологических признаков) лежат в основе (большего) количества измеряемых переменных. Затем 2), основываясь на факторных нагрузках, мы пытаемся описать, каковы эти факторы на самом деле.

Вы не «развиваете» 6 факторов, вы «пытаетесь измерить» 6 факторов.

Однако наличие перекрестных нагрузок (переменных, нагруженных несколькими факторами) часто является показателем того, что факторы «пытаются коррелировать» друг с другом. Это имеет смысл, поскольку мы знаем, что в основном все соотносится со всем в реальном мире. Реализация этого наблюдения в вашем анализе с использованием наклонного (вместо ортогонального варимакс) вращения часто избавляет от многих поперечных нагрузок. ИМХО, теоретически это тоже более звучит.

Дайте этому шанс, у вас может получиться больше предметов на фактор. Это может (частично) решить и вашу проблему.

RubenGeert
источник
Большое спасибо за ваш комментарий, почему шесть факторов, которые я могу объяснить с помощью модели, которую я использую, мой профессор не против объяснения 6 факторов, однако ему нужно объяснение, когда можно использовать факторный анализ, который имеет только 2 элемента на фактор , Это все еще остается вопросом.
Митя
Добро пожаловать на сайт @ pythonforspss.org, здесь много полезной информации, +1. Пара замечаний: я слышал, как несколько раз говорилось, что вам нужно как минимум 3 переменные на фактор, но я не знаю, какова (или вообще есть) причина для этого правила. Я отредактировал Q в OP, чтобы сделать английский более плавным; Я вставил фразу, которую вы цитируете, чтобы заменить то, что было там заранее. Возможно, это не было идеальным (я не знал, как перевести то, что, как я думал, ОП пытается сказать), но если это так, то это моя вина, а не Митя. Помните, что английский не является первым языком многих пользователей.
gung - Восстановить Монику
три элемента на фактор - это общее убеждение, которое имеет тенденцию вызывать проблемы на этапе анализа (так как это общее мнение). При этом, если ваши общины высоки (> 0,7), то, вероятно, у вас нет проблем.
richiemorrisroe
Мои сообщества 0,5 или выше ...
Митя
factors are "trying to correlate" with each otherэто мистическая формулировка. Факторы коррелируют или не коррелируют в зависимости от того, как мы их вращаем (моделируем). Довольно высокие «перекрестные нагрузки» возможны с ортогональными факторами с высокой общностью переменной.
ttnphns
1

У меня сейчас такая же проблема. Вот статья, которая рекомендует использовать как минимум 3 элемента на фактор. В исключительных случаях, однако, вы можете использовать количество элементов на фактор (стр. 60). http://www.sajip.co.za/index.php/sajip/article/download/168/165 Мой случай кажется исключительным, поскольку в моем сетевом эксперименте есть только две переменные, которые предоставляют информацию об игроке стратегия и стратегия власти. Может быть, это также может помочь вам узаконить использование 2 предметов для некоторых факторов.

eugentango
источник
1
Этот сайт имеет ряд ссылок , поддерживающий минимум три переменных в правиле фактора: encorewiki.org/display/~nzhao/...