Я только что выполнил (очень) простую линейную регрессию в Genstat и хотел бы включить краткую и содержательную сводку результатов в мой отчет. Я не уверен, что именно или сколько информации я должен включать.
Основные биты моего вывода Genstat выглядят так:
Summary of analysis
Source d.f. s.s. m.s. v.r. F pr.
Regression 1 8128935. 8128935. 814.41 <.001
Residual 53 529015. 9981.
Total 54 8657950. 160332.
Percentage variance accounted for 93.8
Standard error of observations is estimated to be 99.9.
Estimates of parameters
Parameter estimate s.e. t(53) t pr.
Constant 41.5 30.7 1.35 0.182
UKHR_Ref 0.8659 0.0303 28.54 <.001
Я собирался сообщить об этом просто как:
Adjusted R2 = 0.94 (slope = 0.87, p < 0.001; intercept not significantly different from 0).
но коллега предложил, чтобы я также включил, по крайней мере, root mean squared error
(что, я считаю, в этом случае равно стандартной ошибке наблюдений, т. е. 99,9?).
Предоставляет ли RMSE дополнительную полезную информацию, или адекватность соответствия уже адекватно объясняется скорректированным значением R2?
Существуют ли жесткие правила для того, сколько информации нужно сообщать, или это достаточно субъективно?
Огромное спасибо!
источник
Ответы:
Для простой линейной регрессии я бы всегда создавал график зависимости переменной x от переменной y с наложенной на график линией регрессии (всегда отображайте ваши данные, когда это возможно!). Это очень легко скажет вам, насколько хорошо подходит ваша модель, и легко читается для 1 переменной регрессии. Добавление этого к тому, что вы уже получили, вероятно, будет достаточно, хотя вы можете включить некоторые диагностические графики (рычаг, расстояние повара, остатки и т. Д.). Это зависит от того, насколько хорош этот сюжет, и от вашей предполагаемой аудитории, и от любых протоколов, ожидаемых вашей аудиторией.
источник
Я использую, чтобы сообщить коэффициент β плюс 95% CI, значение p и скорректированный Rsquared. Пример:
Если сообщается о множественной регрессии или регрессии с факторными переменными, я сообщаю о коэффициенте, 95% -ном доверительном интервале, значениях p, а затем отдельно статистику F (градусы свободы), скорректированное значение R2 и значение p модели.
источник