Каким было бы «разумное» минимальное количество наблюдений для поиска тенденции во времени с линейной регрессией? как насчет подгонки квадратичной модели?
Я работаю со сложными показателями неравенства в отношении здоровья (SII, RII), и у меня есть только 4 волны опроса, поэтому 4 балла (1997,2001,2004,2008).
Я не статистика, но у меня интуитивное впечатление, 4 балла недостаточно. У вас есть ответ и / или рекомендации?
Большое спасибо,
Франсуаза
regression
Франсуаза
источник
источник
Ответы:
Эмпирическое правило Петерса 10 на ковариату является разумным правилом. Прямая линия может идеально сочетаться с любыми двумя точками независимо от количества шума в значениях отклика, а квадратичная может быть идеально согласована всего с 3 точками. Ясно, что почти при любых обстоятельствах было бы правильно сказать, что 4 балла недостаточно. Однако, как и большинство эмпирических правил, он не охватывает все ситуации. В случаях, когда коэффициент шума в модели имеет большую дисперсию, потребуется больше выборок, чем в аналогичном случае, когда дисперсия ошибки мала.
Требуемое количество точек отбора зависит от объектов. Если вы проводите исследовательский анализ только для того, чтобы увидеть, выглядит ли одна модель (скажем, линейная в ковариате) лучше, чем другая (скажем, квадратичная функция ковариаты), вам может быть достаточно менее 10 баллов. Но если вам нужны очень точные оценки коэффициентов корреляции и регрессии для ковариат, вам может потребоваться более 10 на ковариату. Критерий точности прогнозирования может потребовать даже больше выборок, чем точных оценок параметров. Обратите внимание, что дисперсия оценок и прогноза включает в себя дисперсию ошибки модели.
источник