Как мне интерпретировать вывод лавы?

11

Я пытаюсь использовать подтверждающий факторный анализ (CFA) lavaan. Мне трудно интерпретировать результат, созданный lavaan.

У меня есть простая модель - 4 фактора, каждый из которых поддерживается элементами из собранных данных опроса. Коэффициенты соответствуют тому, что измеряется элементами, в той степени, в которой представляется вероятным, что они могут служить в качестве действительного измерения.

Пожалуйста, помогите мне понять следующий вывод, производимый lavaans cfa():

 Number of observations                          1730

  Estimator                                         ML
  Minimum Function Test Statistic              196.634
  Degrees of freedom                                21
  P-value (Chi-square)                           0.000

Model test baseline model:

  Minimum Function Test Statistic             3957.231
  Degrees of freedom                                36
  P-value                                        0.000

User model versus baseline model:

  Comparative Fit Index (CFI)                    0.955
  Tucker-Lewis Index (TLI)                       0.923

У меня есть эти вопросы:

  1. Как определяется базовая модель?
  2. Учитывая, что для указанных степеней свободы вычисленная статистика Chi-Sq больше, чем можно было бы ожидать, существует ли какая-либо интерпретация для значения p, равного 0,000?
  3. Основываясь на CFI и TLI, кажется, что у меня почти есть разумная модель. Это справедливая интерпретация?
Джуди
источник
Позвольте мне порекомендовать вам присоединиться к группе Google Lavaan, это замечательный ресурс, и Ив, парень, который создает Lavaan, очень активно отвечает на множество вопросов.
robin.datadrivers
Что вы имеете в виду во втором вопросе? р -значение от 0,000 просто означает , что р -значение является <0,0005 (обычно вы, вероятно , сообщит об этом как р <.001).
Патрик Куломб

Ответы:

13

1) Базовая линия - это нулевая модель, в которой все ваши наблюдаемые переменные ограничены коварией без других переменных (другими словами, ковариации установлены на 0) - оцениваются только отдельные отклонения. Это то, что часто воспринимается как «разумная» модель наихудшего соответствия, с которой сравнивается ваша подобранная модель для расчета относительных показателей соответствия модели (например, CFI / TLI).

2) Статистика хи-квадрат (помеченная как минимальная статистика функционального теста) используется для выполнения теста идеального соответствия модели, как для заданных вами, так и для нулевых / базовых моделей. По сути, это мера отклонения между вашей подразумеваемой моделью дисперсионной / ковариационной матрицей и вашей наблюдаемой дисперсионной / ковариационной матрицей. В обоих случаях ноль идеальной подгонки отклоняется ( p<.001), хотя это предусмотрено проектом в случае базовой / нулевой модели. Некоторые специалисты по статистике (например, Klein, 2010) утверждают, что критерий соответствия хи-квадрат модели полезен при оценке качества модели, но большинство других не одобряют много внимания при ее интерпретации, как для концептуального (т. Е. Для нулевого идеальная подгонка нецелесообразна) и практические (т. е. тест хи-квадрат чувствителен к размеру выборки) (см., например, Brown, 2015; Little, 2013). Это, однако, полезно для расчета ряда других, более информативных, индексов соответствия модели.

3) Стандарты того, какой уровень соответствия модели считается «приемлемым», могут отличаться от дисциплины к дисциплине, но, по крайней мере, согласно Hu & Bentler (1999), вы находитесь в пределах того, что считается «приемлемым». CFI 0,955 часто считается «хорошим». Имейте в виду, однако, что TLI и CFI являются относительными показателями соответствия модели - они сравнивают соответствие вашей модели с соответствием вашей (наихудшей) нулевой модели. Hu & Bentler (1999) предложил вам интерпретировать / сообщать как относительный, так и абсолютный индекс соответствия модели. Абсолютные индексы соответствия модели сравнивают соответствие вашей модели с идеальной моделью соответствия - RMSEA и SRMR являются парой хороших кандидатов (первый часто вычисляется вместе с доверительным интервалом, что приятно).

Рекомендации

Браун, ТА (2015). Подтверждающий факторный анализ для прикладных исследований (2-е издание) . Нью-Йорк, Нью-Йорк: Гилфорд Пресс.

Hu, L. & Bentler, PM (1999). Критерии отсечения для индексов соответствия в анализе ковариационной структуры: обычные критерии против новых альтернатив. Моделирование структурных уравнений , 6 , 1-55.

Клайн, РБ (2010). Принципы и практика моделирования структурных уравнений (3-е издание) . Нью-Йорк, Нью-Йорк: Гилфорд Пресс.

Литтл, ТД (2013). Моделирование продольного структурного уравнения . Нью-Йорк, Нью-Йорк: Гилфорд Пресс.

jsakaluk
источник
Спасибо за ссылки. Это было действительно полезно!
Джуди
1
Нет проблем, @Judy. Браун (2015), Литтл (2013 - даже если вы не планируете заниматься продольным моделированием) и Боужан (2014) - все они предоставляют действительно доступные введения в SEM. Я бы порекомендовал Beaujean (2014) больше всего, если вы планируете в первую очередь полагаться на пакет R / Lavaan. Но концептуально, они все большие вводные ресурсы.
jsakaluk
@jsakaluk Как бы вы определили базовую нулевую модель в продольном контексте? Я прочитал части книги Литтла о продольной SEM (2013), но не уверен, включает ли нулевая модель ковариации между факторами.
Amonet
Это зависит от того, какую нулевую модель вы пытаетесь указать. Ручное определение традиционной нулевой модели имеет свои случайные применения, но Литтл (2013) также обсуждал альтернативную нулевую модель, которая могла бы быть указана для продольных моделей (и меня не удивило бы, если бы были другие). Это кажется немного странным для обсуждения здесь, но новый вопрос может стоить.
jsakaluk