Меня зовут Хью, и я аспирант, использующий обобщенные аддитивные модели, чтобы провести некоторый исследовательский анализ.
Я не уверен, как интерпретировать p-значения, полученные из пакета MGCV, и хотел проверить мое понимание (я использую версию 1.7-29 и ознакомился с некоторыми документами Саймона Вуда). Сначала я искал другие CV-вопросы, но, похоже, наиболее важные из них касаются общих регрессий, а не P-значений GAM в частности.
Я знаю, что есть много разных аргументов в пользу GAM, и значения p являются только приблизительными. Но я просто начинаю с простого, чтобы увидеть, есть ли какой-нибудь «сигнал» для моих ковариат. Например:
Y ~ s (a, k = 3) + s (b, k = 3) + s (c, k = 3) + s (d, k = 3) + s (e, k = 3)
Приблизительные значения p гладких членов:
s (a) = 0,000473
s (b) = 1,13e-05
s (c) = 0,000736
s (d) = 0,887579
s (e) = 0,234017
R ² (скорректированный) = 0,62 Deviance объяснил = 63,7%
балл GCV = 411,17 Scale Est. = 390,1 n = 120
Я вырезал столбцы df и т. Д. Из-за форматирования. Я интерпретирую p-значения для каждого ковариата как тест того, значительно ли соответствующая гладкая функция значительно уменьшает отклонение модели, где p - вероятность получения данных, по крайней мере, столь же «относительно неправдоподобных», что и наблюдаемая при нулевой модели 0.
Это будет означать, что (например, при альфа = 0,05) сглаженные функции не уменьшают отклонения для «d» и «e» по сравнению с нулевой моделью, в отличие от других слагаемых. Следовательно, (d) и (e) не добавляют существенную информацию к регрессии, и объясненное отклонение сводится к (a) (b) (c)?
Любой совет будет принят с благодарностью, и удачи в ваших исследованиях.