Насколько я понимаю, не может быть отрицательным, поскольку это квадрат R. Однако я запустил простую линейную регрессию в SPSS с одной независимой переменной и зависимой переменной. Мой вывод SPSS дает мне отрицательное значение для . Если бы я должен был вычислить это вручную из R, то был бы положительным. Что SPSS сделал, чтобы рассчитать это как отрицательное?R 2 R 2
R=-.395
R squared =-.156
B (un-standardized)=-1261.611
Код, который я использовал:
DATASET ACTIVATE DataSet1.
REGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10) /NOORIGIN
/DEPENDENT valueP /METHOD=ENTER ageP
Я получаю отрицательное значение. Кто-нибудь может объяснить, что это значит?
Ответы:
R 2 R 2 R 2R2 сравнивает соответствие выбранной модели с горизонтальной прямой (нулевая гипотеза). Если выбранная модель подходит хуже, чем горизонтальная линия, то является отрицательным. Обратите внимание, что не всегда является квадратом чего-либо, поэтому он может иметь отрицательное значение, не нарушая никаких правил математики. отрицателен только тогда, когда выбранная модель не следует тренду данных, поэтому подходит хуже, чем горизонтальная линия.R2 R2 R2
Пример: подгонка данных к модели линейной регрессии, ограниченной так, чтобы должно было равняться .1500Y 1500
Модель не имеет никакого смысла, учитывая эти данные. Это явно неправильная модель, возможно, выбранная случайно.
Подгонка модели (прямая, ограниченная проходом через точку (0,1500)) хуже, чем подгонка горизонтальной линии. Таким образом, сумма квадратов из модели больше, чем сумма квадратов из горизонтальной линии . вычисляется как . Когда больше, чем , это уравнение вычисляет отрицательное значение для .( S S tot ) R 2 1 - S S reg(SSreg) (SStot) R2 SSregSStotR21−SSregSStot SSreg SStot R2
При линейной регрессии без ограничений должно быть положительным (или нулевым) и равно квадрату коэффициента корреляции . Отрицательное значение возможно только при линейной регрессии, когда ограничены либо точка пересечения, либо наклон, так что линия «наилучшего соответствия» (с учетом ограничения) подходит хуже, чем горизонтальная линия. При нелинейной регрессии может быть отрицательным, когда модель наилучшего соответствия (с учетом выбранного уравнения и его ограничений, если таковые имеются) соответствует данным, которые хуже горизонтальной линии. r R 2 R 2R2 r R2 R2
Итог: отрицательный не является математической невозможностью или признаком компьютерной ошибки. Это просто означает, что выбранная модель (с ее ограничениями) очень плохо вписывается в данные.R2
источник
Вы забыли включить перехват в свою регрессию? Я не знаком с кодом SPSS, но на странице 21 Эконометрики Хаяси:
Я бы проверил и убедился, что SPSS включает перехват в вашей регрессии.
источник
NOORIGIN
бы, что это будет означать, что перехват не был включен в модель, просто уходя от имени.Это может произойти, если у вас есть временной ряд, который является Niid, и вы строите неподходящую модель ARIMA вида (0,1,0), которая представляет собой модель случайного блуждания с первой разницей без смещения, а затем с дисперсией (сумма квадратов - SSE) из остатков будет больше, чем дисперсия (сумма квадратов SSO) исходного ряда. Таким образом, уравнение 1-SSE / SSO даст отрицательное число, поскольку SSE превышает SSO. Мы видели это, когда пользователи просто соответствуют предполагаемой модели или используют неадекватные процедуры, чтобы идентифицировать / сформировать соответствующую структуру ARIMA. Более широкое сообщение - то, что модель может исказить (как пара плохих очков) ваше зрение. Без доступа к вашим данным у меня не было бы проблемы с объяснением ваших ошибочных результатов. Вы довели это до сведения IBM?
Идея предполагаемой модели, являющейся контрпродуктивной, была поддержана Харви Мотульским. Отличный пост Харви!
источник