Выборочное распределение коэффициентов регрессии

11

Ранее я узнал о распределениях выборки, которые дали результаты, которые были для оценки, с точки зрения неизвестного параметра. Например, для выборочных распределений и в модели линейной регрессии β 1Уя=βо+β1Xя+εяβ^0β^1Yязнак равноβо+β1Икся+εя

β^0N(β0, σ2(1n+x¯2Sxx))
и
β^1~N(β1, σ2SИксИкс)

гдеSИксИксзнак равноΣязнак равно1N(Икся2)-NИкс¯2

Но теперь я увидел в книге следующее :

Предположим, мы подгоняем модель по методу наименьших квадратов обычным способом. Рассмотрим байесовское апостериорное распределение и выберите приоры так, чтобы это было эквивалентно обычному распределению выборки по частоте, то есть ......

(β0β1)~N2[(β^1β^2), σ^2(NΣязнак равно1NИксяΣязнак равно1NИксяΣязнак равно1NИкся2)-1]

Это смущает меня, потому что:

  1. Почему оценки появляются в левой части (lhs) первых 2 выражений и в правой части (rhs) последнего выражения?
  2. Почему бета-шапки в последнем выражении имеют 1 и 2 подписки вместо 0 и 1?
  3. Это просто разные представления одного и того же? Если они есть, кто-то может показать мои, как они эквивалентны? Если нет, может кто-нибудь объяснить разницу?
  4. Это тот случай, когда последнее выражение является «инверсией» первых двух? Поэтому матрица 2x2 в последнем выражении инвертируется, а оценки / параметры переключаются с rhs lhs? Если так, может кто-нибудь показать мне, как добраться от одного к другим?
Джо Кинг
источник

Ответы:

7

Эта часть в первую очередь относится к вашему первому, третьему и четвертому вопросу:

Есть фундаментальная разница между байесовской статистикой и статистикой частых.

θ

п(θ|Икс_)

Это приводит к тому, что вещи, которые часто выглядят одинаково, но где переменные в одном выглядят «неверно», смотрят сквозь призму другого мышления об этом.

Итак, по сути это несколько разные вещи, и тот факт, что вещи, которые находятся на LHS одного, находятся на RHS другого, не является случайностью.

Если вы поработаете с обоими, это скоро станет достаточно ясным.

Второй вопрос, как мне кажется, касается просто опечатки.

---

утверждение «эквивалентно обычному распределению выборки по частоте, то есть»: я понял, что авторы указали распределение выборки по частоте. Я прочитал это неправильно?

Там происходит две вещи - они выражают что-то немного вяло (люди все время делают это особенное чрезмерно свободное выражение), и я думаю, что вы также интерпретируете это иначе, чем намерение.

Что именно означает выражение, которое они дают?

Надеемся, что обсуждение ниже поможет прояснить предполагаемый смысл.

Если вы можете предоставить ссылку (предпочтительно онлайн, поскольку у меня нет хорошего доступа к библиотеке), где это выражение получено, я был бы признателен.

Отсюда следует прямо:

http://en.wikipedia.org/wiki/Bayesian_linear_regression

βσ2

Причина состоит в том, что апостериор, таким образом, пропорционален вероятности, и интервалы, сгенерированные из последующих значений параметров, соответствуют частым доверительным интервалам для параметров.

Вы можете также найти первые несколько страниц здесь полезными.

Glen_b - Восстановить Монику
источник
Спасибо, это полезно. Я уже сделал небольшую байесовскую статистику. Я все еще несколько сбит с толку из-за утверждения «эквивалентно обычному распределению выборки по частоте, то есть» : я понял, что авторы заявляют о распределении выборки по частоте. Я прочитал это неправильно? Что именно означает выражение, которое они дают? Если вы можете предоставить ссылку (предпочтительно онлайн, поскольку у меня нет хорошего доступа к библиотеке), где это выражение получено, я был бы признателен.
Джо Кинг,
Джо - см. Мое редактирование выше
Glen_b