Хорошо, так что немного помутнение некоторых вещей, любая помощь будет высоко ценится. Насколько я понимаю, модель линейной регрессии прогнозируется через условное ожидание
- Предполагаем ли мы, что и являются случайными переменными с некоторым неизвестным распределением вероятности? Насколько я понимаю, только остатки и предполагаемые бета-коэффициенты были случайными величинами. если это так, например, если Y = ожирение и X = возраст, если мы возьмем значение условного ожидания E (Y | X = 35) , каково ожидаемое значение ожирения, если индивидуум составляет 35 по выборке, мы бы просто возьмите среднее (среднее арифметическое) y для тех наблюдений, где X = 35 ? но разве ожидаемое значение не означает, что мы должны умножить это на вероятность возникновения? но как в этом смысле мы находим вероятность Xпеременная, встречающаяся, если она представляет что-то вроде возраста?
- Если бы представлял что-то вроде обменного курса, было бы это классифицировано как случайное? с какой стати вы нашли бы ожидаемое значение этого, не зная вероятности, хотя? или будет ожидаемое значение равным среднему значению в пределе.
- Если мы не предполагаем, что зависимые переменные сами являются случайными переменными, так как мы не упускаем вероятность, что мы предполагаем, что они? просто фиксированные значения или что-то? но если это так, как мы можем начать с неслучайной переменной? Что мы предполагаем о распределении независимых переменных?
Извините, если что-то не имеет смысла или очевидно для всех.
regression
Уильям Карулли
источник
источник
Ответы:
В вероятностной модели, лежащей в основе линейной регрессии, X и Y являются случайными величинами.
Вот так. В общем, вы не можете ожидать, что у вас будет достаточно данных для каждого конкретного значения X, или это может быть невозможно, если X может принимать непрерывный диапазон значений. Но концептуально это правильно.
Это разница между безусловным ожиданием и условным ожиданием . Отношения между нимиE [ Y ∣ X = x ]E[Y] E[Y∣X=x]
который является законом полного ожидания.
Как правило, вы не в линейной регрессии. Поскольку мы пытаемся определить , нам не нужно знать P r [ X = x ] .Е[ Y| X] пr [ х= х ]
Мы же считаем , что Y является случайной величиной. Один из способов думать о линейной регрессии - это модель вероятности дляY
Это говорит о том, что, когда вы знаете значение X, случайное изменение Y ограничивается слагаемым .N( 0 , σ)
источник
Будет много ответов на этот вопрос, но я все еще хочу добавить один, так как вы сделали несколько интересных замечаний. Для простоты я рассматриваю только простую линейную модель.
Основное уравнение простого линейного регрессионного анализа: Это уравнение означает, что среднее значение Y является линейным от значений X . Можно также заметить, что ожидаемое значение также является линейным по параметрам β 0 и β 1 , поэтому модель называется линейной. Это фундаментальное уравнение можно переписать так: Y = β 0 + β 1 X + ϵ , где ϵ - случайная величина со средним нулем: E ( ϵ ) =
Оценщик условного среднего наименьшего квадрата имеет выражение, равное описанному вами, если ваша модель рассматривает различные веса как уровни одного фактора. Эти модели также известны как односторонняя ANOVA, которая является частным случаем (не простой) линейной модели.
источник