Я провел простую линейную регрессию натурального логарифма двух переменных, чтобы определить, коррелируют ли они. Мой вывод такой:
R^2 = 0.0893
slope = 0.851
p < 0.001
Я запутался. Глядя на значение , я бы сказал, что две переменные не коррелированы, так как оно очень близко к . Однако наклон линии регрессии почти равен (несмотря на то, что на графике он выглядит почти горизонтальным), а значение p указывает на то, что регрессия очень значительна. 0 1
Означает ли это , что две переменные имеют высокую корреляцию? Если это так, что означает значение ?
Я должен добавить, что статистика Дурбина-Ватсона была протестирована в моем программном обеспечении и не отвергала нулевую гипотезу (она равнялась ). Я думал, что это проверено на независимость между переменными. В этом случае я бы ожидал, что переменные будут зависимыми, так как они являются измерениями отдельной птицы. Я делаю эту регрессию как часть опубликованного метода для определения состояния тела человека, поэтому я предположил, что использование регрессии таким образом имело смысл. Однако, учитывая эти результаты, я думаю, что, возможно, для этих птиц этот метод не подходит. Кажется ли это разумным выводом?2 2
источник
Ответы:
Расчетное значение уклона само по себе не говорит о силе отношений. Степень взаимосвязи зависит от размера ошибки и диапазона предиктора. Кроме того, значимое значение не обязательно говорит о наличии сильных отношений; -значение просто тестирование ли наклон точно 0. При достаточно большого размера выборки, даже небольшие отклонения от этой гипотезы (например , те , которые не практического значения) даст значительную -значение.р рп п п
Из трех представленных вами величин , коэффициент детерминации , дает наибольшее представление о силе отношений. В вашем случае означает, что изменения вашей ответной переменной можно объяснить линейной связью с предиктором. То, что составляет «большой» зависит от дисциплины. Например, в социальных науках может быть «большим», но в контролируемых средах, таких как заводские настройки, может потребоваться, чтобы сказать, что существует «сильная» связь. В большинстве ситуаций очень маленькийR 2 = .089 8,9 % R 2 R 2 = .2 R 2 > .9 .089 R 2р2 р2= .089 8,9 % р2 р2= .2 р2> .9 0,089 р2 , поэтому ваш вывод о наличии слабых линейных отношений, вероятно, обоснован.
источник
говорит вам , сколько изменение зависимой переменной объясняется моделью. Тем не менее, можно интерпретировать а также корреляцию между исходными значениями зависимой переменной и подобранными значениями. Точную интерпретацию и вывод коэффициента детерминации можно найти здесь . R 2 R 2р2 р2 р2
Доказательство того, что коэффициент детерминации является эквивалентом коэффициента корреляции Пирсона Squared между наблюдаемыми значениями и подогнанные значения у я можно найти здесь .Yя Y^я
или коэффициент детерминации указывает на силу вашей модели в объяснения зависимой переменной. В вашем случае R 2 = 0,089 . Это то, что ваша модель способна объяснить 8,9% вариации вашей зависимой переменной. Или, коэффициент корреляции между у I и ваши подобранными значениями у я есть 0,089. То, что составляет хороший R 2, зависит от дисциплины.р2 р2= 0,089 Yя Y^я р2
Наконец, к последней части вашего вопроса. Вы не можете заставить тест Дурбина-Ватсона что-то сказать о корреляции между вашими зависимыми и независимыми переменными. Тест Дурбина-Ватсона для последовательной корреляции. Он проводится для проверки взаимозависимости ваших терминов ошибок.
источник
Значение говорит о том, насколько сильно варьируются данные с помощью подобранной модели.р2
Низкое значение в вашем исследовании предполагает, что ваши данные, вероятно, широко распространены вокруг линии регрессии, а это означает, что регрессионная модель может объяснить (очень мало) 8,9% изменений в данных.р2
Вы проверили, подходит ли линейная модель? Посмотрите на распределение ваших остатков, так как вы можете использовать это для оценки соответствия модели вашим данным. В идеале, ваши остатки не должны показывать связь с вашими значениями , и если это так, вы можете подумать о том, чтобы изменить ваши переменные подходящим способом или подобрать более подходящую модель.Икс
источник
Короче говоря, наклон не является хорошим показателем соответствия модели, если вы не уверены, что шкалы зависимых и независимых переменных должны быть равны друг другу.
источник
Мне нравятся уже даные ответы, но позвольте мне дополнить их другим (и более насмешливым) подходом.
Предположим, мы собрали группу наблюдений от 1000 случайных людей, пытающихся выяснить, связаны ли удары по лицу с головными болями:
Графически это, вероятно, выглядит как крутой склон, но с очень большим изменением вокруг этого склона.
источник
У @Macro был отличный ответ.
Я просто хочу добавить числовой пример, чтобы показать, как выглядит описанный случай.
источник