Насколько я понимаю, критерий Вальда в контексте логистической регрессии используется для определения значимости определенной предикторной переменной или нет. Он отвергает нулевую гипотезу о том, что соответствующий коэффициент равен нулю.
Тест состоит из деления значения коэффициента на стандартную ошибку .
Что меня смущает, так это то, что также известен как Z-оценка и указывает, насколько вероятно, что данное наблюдение приходит из нормального распределения (со средним нулем).
logistic
z-statistic
user695652
источник
источник
Ответы:
Оценки коэффициентов и перехватов в логистической регрессии (и любой GLM) находятся с помощью оценки максимального правдоподобия (MLE). Эти оценки обозначены с шляпой над параметрами, что - то вроде & thetas . Наш интересующий параметр обозначен θ 0, и обычно это 0, поскольку мы хотим проверить, отличается ли коэффициент от 0 или нет. Из асимптотической теории ОМП, мы знаем , что разница между & thetas и θ 0 будет приблизительно нормально распределены со средним 0 (подробности можно найти в любой математической статистике книги , такие как Ларри Вассермана все из статистики ). Напомним, что стандартные ошибки не что иное, какθ^ θ0 θ^ θ0 Стандартные отклонения статистики (Сокал и Рольф пишут в своей книге « Биометрия» : « статистика - это любая из многих вычисленных или оцененных статистических величин», например, среднее значение, медиана, стандартное отклонение, коэффициент корреляции, коэффициент регрессии, ...). Разделив нормальное распределение со средним 0 и стандартным отклонением его стандартное отклонение будет давать стандартное нормальное распределение со средним 0 и стандартное отклонение 1. Wald статистики определяется как (например , Вассермана (2006): Все статистики , страницы 153, 214 -215):
W = ( β - β 0 )σ
или
W2=(β-β0)2
R
, посмотрите на этих двух примерах:Логистическая регрессия
Нормальная линейная регрессия (OLS)
Еще один связанный пост можно найти здесь .
источник