Отчетность о результатах простой линейной регрессии: какую информацию включить?

11

Я только что выполнил (очень) простую линейную регрессию в Genstat и хотел бы включить краткую и содержательную сводку результатов в мой отчет. Я не уверен, что именно или сколько информации я должен включать.

Основные биты моего вывода Genstat выглядят так:

Summary of analysis 
Source      d.f.    s.s.       m.s.       v.r.    F pr.
Regression    1   8128935.   8128935.    814.41   <.001
Residual     53    529015.      9981.        
Total        54   8657950.    160332.        

Percentage variance accounted for 93.8
Standard error of observations is estimated to be 99.9.

Estimates of parameters 
Parameter    estimate    s.e.     t(53)   t pr.
Constant      41.5      30.7       1.35   0.182
UKHR_Ref       0.8659    0.0303   28.54   <.001

Я собирался сообщить об этом просто как:

Adjusted R2 = 0.94 (slope = 0.87, p < 0.001; intercept not significantly different from 0).

но коллега предложил, чтобы я также включил, по крайней мере, root mean squared error(что, я считаю, в этом случае равно стандартной ошибке наблюдений, т. е. 99,9?).

Предоставляет ли RMSE дополнительную полезную информацию, или адекватность соответствия уже адекватно объясняется скорректированным значением R2?

Существуют ли жесткие правила для того, сколько информации нужно сообщать, или это достаточно субъективно?

Огромное спасибо!

Jamess
источник
1
«Существуют ли жесткие правила для того, сколько информации нужно сообщать» - это действительно зависит от того, что вы хотите сделать после регрессии. Кто-то может быть доволен только коэффициентом корреляции; кому-то может понадобиться значение Дурбина-Ватсона, и еще один может захотеть увидеть диагональ шляпной матрицы ... это действительно зависит.
JM не статистика
2
У некоторых организаций есть правила. См., Например, рекомендации APA .
whuber

Ответы:

6

Для простой линейной регрессии я бы всегда создавал график зависимости переменной x от переменной y с наложенной на график линией регрессии (всегда отображайте ваши данные, когда это возможно!). Это очень легко скажет вам, насколько хорошо подходит ваша модель, и легко читается для 1 переменной регрессии. Добавление этого к тому, что вы уже получили, вероятно, будет достаточно, хотя вы можете включить некоторые диагностические графики (рычаг, расстояние повара, остатки и т. Д.). Это зависит от того, насколько хорош этот сюжет, и от вашей предполагаемой аудитории, и от любых протоколов, ожидаемых вашей аудиторией.

р2

р2±±2р2

probabilityislogic
источник
Спасибо @probabilityislogic. Я включил сюжет в свой отчет, и это звучит так, плюс моего оригинального предложения должно быть достаточно в этом случае. Я думаю, что включение диагностических графиков, вероятно, не нужно для этой аудитории, хотя я, очевидно, проверил их сам, и они выглядят разумно. Спасибо также за объяснение R2 против RMSE - это очень полезно.
Джеймс
А как насчет значений t и df? Когда они должны быть включены? Имеет ли смысл включать оба или ни того, ни другого?
Сумасшедший о Natty
1

Я использую, чтобы сообщить коэффициент β плюс 95% CI, значение p и скорректированный Rsquared. Пример:

(β = 1,46, 95% ДИ [1,19, 1,8], р = 0,001 **, скорректированный R2 = 0,48)

Если сообщается о множественной регрессии или регрессии с факторными переменными, я сообщаю о коэффициенте, 95% -ном доверительном интервале, значениях p, а затем отдельно статистику F (градусы свободы), скорректированное значение R2 и значение p модели.

Bakaburg
источник