Я ищу расширенное тематическое исследование линейной регрессии, иллюстрирующее шаги, необходимые для моделирования сложных, множественных нелинейных отношений с использованием GLM или OLS. На удивление трудно найти ресурсы, выходящие за рамки базовых школьных примеров: большинство книг, которые я прочитал, не пойдет дальше, чем лог-преобразование ответа в сочетании с BoxCox одного предиктора или естественный сплайн в лучшем случае. Также все примеры, которые я видел до сих пор, подходят к каждой проблеме преобразования данных в отдельной модели, часто в одной модели предиктора.
Я знаю, что такое трансформация BoxCox или YeoJohnson. То, что я ищу, является подробным, практическим примером, где ответ / отношения не ясны. Например, ответ не является строго положительным (поэтому вы не можете использовать log или BoxCox), предикторы имеют нелинейные отношения между собой и против ответа, а преобразования данных с максимальной вероятностью, по-видимому, не подразумевают стандарт 0,33. или 0,5 степени. Также обнаружено, что остаточная дисперсия не является постоянной (она никогда не бывает), поэтому необходимо также преобразовать ответ и сделать выбор между нестандартной регрессией семейства GLM или преобразованием ответа. Исследователь, скорее всего, сделает выбор, чтобы избежать перегрузки данных.
РЕДАКТИРОВАТЬ
Пока я собрал следующие ресурсы:
- Стратегии регрессионного моделирования, Ф. Харрелл
- Прикладной эконометрический временной ряд, В. Эндерс
- Динамические линейные модели с R, Г. Петрис
- Прикладной регрессионный анализ, Д. Кляйнбаум
- Введение в статистическое обучение, G. James / D. Виттен
Я только прочитал последний (ISLR), и это очень хороший текст (5 5 звезд на моих часах), хотя он больше ориентирован на ML, чем на расширенное регрессионное моделирование.
Существует также это хороший пост на CV , который представляет собой вызов регрессии болезни.
Ответы:
Стратегии регрессионного моделирования и ISLR, о которых уже упоминали другие, являются двумя очень хорошими предложениями. У меня есть несколько других, которые вы можете рассмотреть.
Прикладное прогнозирующее моделирование Куна и Джонсона содержит ряд хороших примеров и довольно практично.
Обобщенные аддитивные модели: Введение с R от Саймона Вуда - это хорошее описание обобщенных аддитивных моделей и того, как вы подходите им, используя его
mgcv
пакет для R. В нем есть несколько нетривиальных практических примеров. Использование моделей GAM является альтернативой для определения «правильного» преобразования, поскольку это выполняется адаптивным способом данных с помощью сплайнового расширения и штрафной оценки максимального правдоподобия. Однако есть еще другие варианты, которые необходимо сделать, например, выбор функции связи.Пакет mboost для R также подходит для моделей GAM, но использует другой подход с помощью бустинга. Я рекомендую учебник для пакета (одна из виньеток).
Я также упомяну об открытии эмпирической модели и оценке теории Хендри и Доорником, хотя я сам еще не читал эту книгу. Это было рекомендовано мне.
источник
Один из лучших курсовых материалов, которые вы можете найти по продвинутой, множественной, сложной (в том числе нелинейной) регрессии, основан на книге Фрэнка Э. Харрелла младшего «Стратегии регрессионного моделирования».
Книга обсуждается в комментариях, но не в этом материале, который сам по себе является отличным ресурсом.
источник
Я бы порекомендовал книгу Джошуа Д. Ангриста и Йорна-Штеффена Пишке « В основном безвредная эконометрика ».
Это самый настоящий, соленый для земли, текст, которым я владею, и он очень дешевый, около $ 26,00 новый. Книга написана для выпускника статистики / экономиста, поэтому она достаточно продвинута.
Теперь эта книга - не совсем то, о чем вы просите, в том смысле, что она фокусируется не на «сложных, множественных нелинейных отношениях», а на основных принципах, таких как эндогенность, интерпретация и умный регрессионный дизайн.
Но я предлагаю эту книгу, чтобы попытаться сделать точку. То есть, когда речь заходит о применении регрессионного анализа в реальном мире, наиболее сложные вопросы, как правило, не связаны с тем, что наши модели не достаточно сложны ... поверьте, мы очень хорошо разбираемся в очень сложных моделей! Скорее самые большие проблемы такие вещи, как
Точное понимание GMM, нелинейных фильтров и непараметрической регрессии в значительной степени охватывает все темы, которые вы перечислили, и вы можете изучить их по ходу работы. Однако, с данными реального мира, эти структуры могут быть слишком сложными, а зачастую и вредными.
Все чаще всего это умение быть простым, а не полностью обобщенным и очень сложным, что приносит вам наибольшую пользу при анализе в реальном мире. Эта книга поможет вам с первым.
источник
Вы можете сослаться на Введение в статистическое обучение с помощью R (ISLR), в книге подробно рассказывается о сплайнах и полиномиальной регрессии с кейсами.
источник
Я не уверен, какова цель вашего вопроса. Я могу порекомендовать текст эконометрического анализа Грина . У него тонна ссылок на документы внутри. Практически каждый пример в книге ссылается на опубликованную статью.
Чтобы дать вам представление, посмотрите на Пример 7.6 «Эффекты взаимодействия в логлинейной модели дохода» на стр. 195. Это относится к документу и набору данных: Реджина Т. Рифан, Ахим Вамбах и Андреас Миллион, « Стимулирующие эффекты в спросе на медицинское обслуживание: оценка данных двумерной панельной шкалы », Журнал прикладной эконометрики, вып. 18, № 4, 2003, с. 387-405.
Пример касается использования логлинейных моделей и эффектов взаимодействия. Вы можете прочитать всю статью, или это описание учебников. Это не выдуманный вариант использования. Это настоящее опубликованное исследование. Именно так люди на самом деле используют статистические методы в экономических исследованиях.
Как я уже писал, книга изобилует такими примерами использования передовых статистических методов.
источник
Вы изучили некоторые курсы / книги по анализу финансовых временных рядов, которые пишет Рюи Цай (UChicago)?
http://faculty.chicagobooth.edu/ruey.tsay/teaching/
Классы Ruey Tsays и учебник предоставляют множество примеров из реальной жизни в области финансов сложных регрессий того типа, которые созданы для использования на финансовых рынках. Глава 1 начинается с моделей многофакторной регрессии и расширяется до моделей сезонных авторегрессионных временных рядов главами 5 или 6.
источник