Для интервала прогнозирования в линейной регрессии вы все еще используете E [ Y | х ] = ^ & beta ; 0 + β 1 х генерировать интервал. Вы также используете это, чтобы сгенерировать доверительный интервал E [ Y | х 0 ] . В чем разница между двумя?
80
Ответы:
Следовательно, интервал прогнозирования будет шире, чем доверительный интервал.
источник
Разница между интервалом прогнозирования и доверительным интервалом является стандартной ошибкой.
Стандартная ошибка для доверительного интервала в среднем учитывает неопределенность, обусловленную выборкой. Линия, которую вы вычислили по вашей выборке, будет отличаться от линии, которая была бы рассчитана, если бы у вас было все население, стандартная ошибка учитывает эту неопределенность.
Стандартная ошибка для интервала прогнозирования для отдельного наблюдения учитывает неопределенность из-за выборки, как описано выше, но также учитывает изменчивость индивидуумов вокруг прогнозируемого среднего значения. Стандартная ошибка для интервала прогнозирования будет шире, чем для доверительного интервала, и, следовательно, интервал прогнозирования будет шире, чем доверительный интервал.
источник
Я нашел следующее объяснение полезным:
Источник: http://www.graphpad.com/support/faqid/1506/
источник
Один - это прогноз будущего наблюдения, а другой - прогнозируемый средний ответ. Я дам более подробный ответ, чтобы, надеюсь, объяснить разницу и откуда она берется, а также как эта разница проявляется в более широких интервалах для прогноза, чем для уверенности.
Надеюсь, это немного прояснит, почему интервал прогнозирования всегда шире, и какова основная разница между этими двумя интервалами. Этот пример был адаптирован из Faraway, Linear Models with R, Sec. 4.1.
источник
Краткий ответ:
Интервал прогнозирования представляет собой интервал , связанный со случайной переменной еще не наблюдается (прогнозирования).
Доверительный интервал представляет собой интервал , связанный с параметром и является частотной концепцией.
Проверьте полный ответ здесь от Роба Хиндмана, создателя пакета прогноза в R.
источник
Этот ответ предназначен для тех читателей, которые не смогли полностью понять предыдущие ответы. Давайте обсудим конкретный пример. Предположим, вы пытаетесь предсказать вес людей по их росту, полу (мужской, женский) и рациону (стандартный, низкоуглеводный, вегетарианский). В настоящее время на Земле проживает более 8 миллиардов человек. Конечно, вы можете найти много тысяч людей, имеющих одинаковый рост и два других параметра, но разный вес. Их вес сильно отличается, потому что некоторые из них страдают ожирением, а другие могут страдать от голода. Большинство из этих людей будут где-то посередине.
Одна из задач состоит в прогнозировании среднего веса всех людей, имеющих одинаковые значения всех трех объясняющих переменных. Здесь мы используем доверительный интервал. Другая проблема заключается в прогнозировании веса какого-то конкретного человека. И мы не знаем жизненных обстоятельств этого человека. Здесь должен использоваться интервал прогнозирования. Он сосредоточен вокруг одной и той же точки, но он должен быть намного шире, чем доверительный интервал.
источник