Является ли преобразование модели многомерной линейной регрессии в множественную линейную регрессию полностью эквивалентным? Я не имею в виду , просто запустив отдельных регрессий.
Я читал это в нескольких местах (Байесовский анализ данных - Гельман и др. И Многовариантная старая школа - Марден), что многомерная линейная модель может быть легко репараметризована как множественная регрессия. Однако ни один источник не уточняет это вообще. По сути, они просто упоминают об этом, а затем продолжают использовать многомерную модель. Математически я сначала напишу многовариантную версию,
Чтобы перепараметрировать это как знакомую множественную линейную регрессию, нужно просто переписать переменные следующим образом:
где используются повторные параметры: , и . означает, что строки матрицы расположены последовательно в длинный вектор, а - это произведение Кронекера, или внешнее произведение.β = r o w ( B ) D = X ⊗ I n r o w ( ) ⊗
Итак, если это так просто, зачем писать книги по многомерным моделям, тестировать статистику для них и т. Д.? Наиболее эффективно сначала преобразовать переменные и использовать обычные одномерные методы. Я уверен, что есть веская причина, мне просто трудно думать об этом, по крайней мере, в случае линейной модели. Существуют ли ситуации с многомерной линейной моделью и нормально распределенными случайными ошибками, когда эта репараметризация не применяется или ограничивает возможности анализа, который вы можете предпринять?
Источники, которые я видел это: Марден - многомерная статистика: Старая школа. Смотрите разделы 5.3 - 5.5. Книга доступна бесплатно по адресу : http://istics.net/stat/
Гельман и соавт. - Байесовский анализ данных. У меня есть второе издание, и в этой версии есть небольшой абзац в гл. 19 «Модели многомерной регрессии» под названием «Эквивалентная модель одномерной регрессии»
В принципе, можете ли вы сделать все с помощью эквивалентной модели линейной одномерной регрессии, которую вы могли бы сделать с помощью многомерной модели? Если так, зачем вообще разрабатывать методы для многомерных линейных моделей?
А как насчет байесовских подходов?
Ответы:
Я считаю, что ответ - нет.
Если ваша цель - просто оценить эффекты (параметры в ) или сделать дальнейшие прогнозы, основанные на модели, тогда да, не имеет значения принимать какую модель формулировки между этими двумя.В
Тем не менее, чтобы сделать статистические выводы, особенно для проведения классического тестирования значимости, многомерная формулировка кажется практически незаменимой. В частности, позвольте мне использовать типичный анализ данных в психологии в качестве примера. Данные по субъектам выражены какN
С вышеупомянутой формулировкой любая общая линейная гипотеза может быть легко выражена как
Прелесть многомерной системы заключается в ее разделении между двумя типами переменных, между субъектом и внутри него. Именно это разделение позволяет легко сформулировать три типа значимого тестирования в многомерной структуре: классическое многомерное тестирование, многофакторное тестирование с повторными измерениями и одномерное тестирование с повторными измерениями. Кроме того, тестирование Моучли на нарушение сферичности и соответствующие методы коррекции (Greenhouse-Geisser и Huynh-Feldt) также становятся естественными для одномерного тестирования в многомерной системе. Именно так статистические пакеты реализовали эти тесты, такие как car в R, GLM в IBM SPSS Statistics и оператор REPEATED в PROC GLM SAS.
Я не уверен, имеет ли значение формулировка при анализе байесовских данных, но я сомневаюсь, что вышеупомянутые возможности тестирования могут быть сформулированы и реализованы на основе однофакторной платформы.
источник
Обе модели эквивалентны, если вам подходит соответствующая дисперсионно-ковариационная структура. В преобразованной линейной модели нам нужно согласовать дисперсионно-ковариационную матрицу компонента ошибки с продуктом kronecker, доступность которого ограничена доступными вычислительными программами. Теория линейных моделей - одномерные, многомерные и смешанные модели - отличный справочник по этой теме.
Edited
Вот еще одна хорошая ссылка в свободном доступе.
источник