Пусть LL = логарифмическая вероятность
Вот краткое изложение того, что вы видите из итогового (glm.fit) вывода:
Нулевое отклонение = 2 (LL (насыщенная модель) - LL (нулевая модель)) при df = df_Sat - df_Null
Остаточное отклонение = 2 (LL (насыщенная модель) - LL (предлагаемая модель)) df = df_Sat - df_Proposed
Насыщенная Модель представляет собой модель , которая предполагает , каждую точку данных имеет свои собственные параметры (что означает , что вы п параметров для оценки.)
Null модель предполагает точные «обратную», в который принимает один параметр для всех точек данных, что означает , что вы только оценить 1 параметр.
Предлагаемая модель предполагает , что вы можете объяснить свои точки данных с р параметрами + свободным членом, так что у вас есть р + 1 параметры.
Если ваше нулевое отклонение действительно мало, это означает, что нулевая модель довольно хорошо объясняет данные. Аналогично с вашим остаточным отклонением .
Что на самом деле означает маленький? Если ваша модель "хорошая", то ваша девиантность составляет приблизительно Chi ^ 2 с (df_sat - df_model) степенями свободы.
Если вы хотите сравнить вашу нулевую модель с предложенной моделью, то вы можете посмотреть на
(Нулевое отклонение - Остаточное отклонение) прибл. Chi ^ 2 с df Предложено - df Null = (n- (p + 1)) - (n-1) = p
Результаты, которые вы дали непосредственно от R? Они кажутся немного странными, потому что, как правило, вы должны видеть, что степени свободы, сообщаемые для нулевого значения, всегда выше, чем степени свободы, сообщаемые для остаточного значения. Это потому, что опять Нулевое отклонение df = Насыщенный df - Нулевое df = n-1 Остаточное отклонение df = Насыщенный df - Предлагаемый df = n- (p + 1)
GLM
?Нулевое отклонение показывает, насколько хорошо модель предсказывает отклик без перехвата.
Остаточное отклонение показывает, насколько хорошо модель прогнозируется, когда включены предикторы. Из вашего примера видно, что отклонение увеличивается на 3443,3 при добавлении 22 переменных-предикторов (примечание: степени свободы = количество наблюдений - количество предсказателей). Это увеличение отклонения свидетельствует о значительном отсутствии соответствия.
Мы также можем использовать остаточное отклонение, чтобы проверить, верна ли нулевая гипотеза (т. Е. Модель логистической регрессии обеспечивает адекватное соответствие данных). Это возможно, потому что отклонение задается значением хи-квадрат при определенных степенях свободы. Чтобы проверить значимость, мы можем узнать связанные значения p, используя приведенную ниже формулу в R:
Используя приведенные выше значения остаточного отклонения и DF, вы получаете значение p, равное приблизительно нулю, что свидетельствует о существенном отсутствии доказательств в поддержку нулевой гипотезы.
источник