Этот вопрос был задан здесь, но никто не дал хорошего ответа. Поэтому я думаю, что это хорошая идея, чтобы поднять это снова, а также я хотел бы добавить еще несколько комментариев / вопросов.
Первый вопрос: в чем разница между «моделированием пути PLS» и «регрессией PLS»? Чтобы сделать его более общим, что такое моделирование структурных уравнений (SEM), моделирование путей и регрессия? Насколько я понимаю, регрессия больше фокусируется на прогнозировании, в то время как SEM фокусируется на взаимосвязи между ответом и предикторами, а моделирование пути является частным случаем SEM?
Второй вопрос: насколько PLS заслуживает доверия? В последнее время он подвергался многочисленной критике, как подчеркивалось в Rönkkö et al. 2016 и Rönkkö et al. 2015, что приводит к отклонению статей на основе PLS в журналах высокого уровня, таких как Журнал управления операциями ( вот примечание редактора журнала):
Мы категорически отвергаем практически все рукописи на основе PLS, потому что пришли к выводу, что PLS был без исключения неправильным подходом к моделированию в тех моделях, которые используют исследователи OM .
Я должен отметить, что моя область - спектроскопия, ни управление / психология, ни статистика. В ссылках, приведенных выше, авторы больше говорят о PLS как методе SEM, но для меня их критика выглядит применимой и к регрессии PLS.
Ответы:
Нет, они являются синонимами.
SEM является формой регрессии. Регрессия - это любой метод, который коррелирует независимые и зависимые переменные и включает методы, которые используют несколько переменных, обрабатываемых как отдельные объекты. SEM специально использует математические отношения между переменными для ограничения окончательной модели, в случае PLS это ковариация. Насколько я понимаю, моделирование пути - это предметный (не мой, я спектроскопист, как вы) конкретный термин.
Отличное опровержение найдено в Henseler et al. Общие верования и реальность 2013 года о PLS . Основная проблема Rönkkö et al. заключается в том, что PLS не очень хорошо работает в некоторых ситуациях, которые предполагают общий скрытый фактор. PLS на самом деле предназначен для работы с множеством скрытых факторов, ситуация, которая гораздо чаще встречается в реальном мире.
Насколько можно доверять? Для спектроскопии это отличный инструмент, но у него есть свои ограничения. Это создает риск переоснащения, поскольку может создавать сложные модели, в которых учитывается вклад множества факторов. По этой причине его необходимо использовать с осторожностью, и необходима соответствующая внешняя проверка, но тогда эти предостережения применимы ко всем инструментам построения моделей. Я работаю в основном над наборами данных реального мира в течение двух десятилетий, и я не встречал ни одного экспериментального набора данных, у которого был бы только один общий фактор, лежащий в основе зависимой переменной (ни на основе данных, ни на научной теории).
источник