Предположим, что ваш набор данных состоит из набора для i = 1 , … , n, и вы хотите посмотреть на зависимость y от x .(xi,yi)i=1,…,nyx
Предположим , что вы найдете значения α и β в α и β , которые минимизируют остаточную сумму квадратов
п Е я = 1 ( у я - ( α + β х я ) ) 2 .
Тогда вы берете у = α + β х будет предсказанное у -значение для любого (не обязательно уже наблюдается) х -value. Это линейная регрессия.α^β^αβ
∑i=1n(yi−(α+βxi))2.
y^=α^+β^xyx
Теперь рассмотрим разложение полной суммы квадратов
сп-1степенями свободы, в "объяснено" и "необъяснимые" части:
п Σ я = 1 ( ( α + β х я ) - ˉ у ) 2 ⏟ объяснено+ п Σ я = 1 ( у я - ( α + β х я ) ) 2 ⏟ необъясненный.
с1
∑i=1n(yi−y¯)2where y¯=y1+⋯+ynn
n−1∑i=1n((α^+β^xi)−y¯)2explained + ∑i=1n(yi−(α^+β^xi))2unexplained.
1и
степени свободы соответственно. Это дисперсионный анализ, а затем один считает такие вещи , как F-статистики
F = Е п я = 1 ( ( & alpha ; + & beta ; х я ) - ˉ у ) 2 / 1n−2ЭтаF-статистика проверяет нулевую гипотезу
β=0.
F=∑ni=1((α^+β^xi)−y¯)2/1∑ni=1(yi−(α^+β^xi))2/(n−2).
β=0
y=α+βi
ikk−1n−k
Пара дополнительных очков:
- Некоторым математикам приведенный выше отчет может создать впечатление, что целое поле - это только то, что видно выше, поэтому может показаться загадочным, что регрессия и анализ отклонений являются активными областями исследований. Есть много вещей, которые не вписываются в ответ, подходящий для публикации здесь.
- y=α+βx
Основным отличием является переменная ответа. В то время как логистическая регрессия имеет дело с двоичным ответом в линейном регрессионном анализе, а также с нелинейной регрессией, переменная ответа является непрерывной. У вас есть переменная (и) (или ковариата (ы)), которые функционально связаны с переменной непрерывного ответа. При анализе отклонений ответ является непрерывным, но он относится к нескольким различным категориям (например, группа лечения и контрольная группа). При анализе отклонений вы ищете разницу в среднем ответе между группами. В линейной регрессии вы смотрите, как изменяется ответ при изменении ковариат. Другой способ взглянуть на разницу - сказать, что в регрессии ковариаты непрерывны, тогда как в дисперсионном анализе они представляют собой дискретный набор групп.
источник
Дисперсионный анализ (ANOVA) представляет собой совокупность статистического метода анализа наблюдений, предположительно имеющих структуру
В основном это два вида анализа.
источник
В регрессионном анализе у вас есть одна фиксированная переменная, и вы хотите знать, как переменная идет с другой переменной.
При анализе отклонений вы хотите знать, например: Если эта конкретная пища для животных влияет на вес животных ... ТАК один фиксированный вариант и влияние на других.
источник