У меня есть пара вопросов для прогнозирования и интервалов терпимости.
Давайте сначала договоримся об определении интервалов толерантности: нам дают уровень достоверности, скажем, 90%, процент населения, подлежащего отбору, скажем, 99%, и размер выборки, скажем, 20. Распределение вероятностей известно, скажем, нормально для удобства. Теперь, учитывая вышеприведенные три числа (90%, 99% и 20) и тот факт, что базовое распределение является нормальным, мы можем вычислить число допусков . Для выборки со средним значением и стандартным отклонением интервал допуска составляет . Если этот интервал допуска охватывает 99% населения, то выборка называется успешной( х 1 , х 2 , ... , х 20 ) ˉ х с ˉ х ± к с ( х 1 , х 2 , ... , х 20 )и требование состоит в том, чтобы 90% образцов были успешными .
Комментарий: 90% - это априорная вероятность успеха образца. 99% - это условная вероятность того, что будущее наблюдение будет в интервале допуска, учитывая, что выборка является успешной.
Мои вопросы: можем ли мы видеть интервалы предсказания как интервалы терпимости? Просматривая в Интернете, я получил противоречивые ответы на этот вопрос, не говоря уже о том, что никто точно не определил интервалы прогнозирования. Итак, если у вас есть точное определение интервала прогнозирования (или ссылка), я был бы признателен.
Я понял, что интервал прогнозирования 99%, например, не охватывает 99% всех будущих значений для всех выборок. Это будет то же самое, что и интервал допуска, который охватывает 99% населения с вероятностью 100%.
В определениях, которые я нашел для 90% -ного интервала прогнозирования, 90% - это априорная вероятность для данной выборки, скажем, (размер фиксирован) и одно будущее наблюдение , которое будет в интервале прогнозирования. Таким образом, кажется, что и выборка, и будущая стоимость даются одновременно, в отличие от интервала допуска, где предоставляется выборка, и с определенной вероятностью это успех , и при условии, что выборка успеху уопределяется будущее значение и с определенной вероятностью попадает в интервал допуска. Я не уверен, является ли приведенное выше определение интервала предсказания правильным или нет, но оно кажется нелогичным (по крайней мере).
Любая помощь?
источник
Ответы:
Ваши определения кажутся правильными.
Книга консультируйтесь этих вопросах Интервалы статистический (Gerald Hahn & William Meeker), 1991. Я цитирую:
Вот пересказ в стандартной математической терминологии. Пусть данные считаются реализацией независимых случайных величин X = ( X 1 , … , X n ) с общей интегральной функцией распределения F θ . ( θ является напоминанием о том, что F может быть неизвестным, но предполагается, что он лежит в данном наборе распределений F θ | θ ∈ Θ ). Пусть Х 0х =( х1, … , ХN) Х =( Х1, … , XN) Fθ θ F Fθ| θ ∈ Θ Икс0 быть другой случайной величиной с тем же распределением и независимым от первых n переменных.Fθ N
Интервал предсказания (для одного наблюдения в будущем), определяется конечными точками , имеет определяющее свойство , что[ l ( x ) , u ( x ) ]
В частности, относится к распределению n + 1 переменных ( X 0 , X 1 , … , X n ), определяемому по закону F θ . Обратите внимание на отсутствие каких-либо условных вероятностей: это полная совместная вероятность. Также обратите внимание на отсутствие какой-либо ссылки на временную последовательность: очень хорошо может наблюдаться X 0 во времени перед другими значениями. Это не имеет значения.Prθ n + 1 ( Х0, X1, … , XN) Fθ Икс0
Я не уверен, какой аспект (ы) этого может быть "нелогичным". Если мы планируем выбрать статистическую процедуру в качестве действия, которое необходимо выполнить перед сбором данных, то это естественная и разумная формулировка запланированного двухэтапного процесса, потому что оба данных ( ) и «будущее значение» X 0 должно быть смоделировано как случайное.Икся, я = 1 , ... , п Икс0
Интервал допуска, определяется конечными точками , имеет определяющее свойство , что( L ( x ) , U( х ) ]
Обратите внимание на отсутствие какой-либо ссылки на : это не играет никакой роли.Икс0
Когда является множеством нормальных распределений, существуют интервалы прогнозирования в форме{ Fθ}
( - среднее значение по выборке, а s - стандартное отклонение по выборке). Значения функции k , которые табулируют Hahn & Meeker, не зависят от данных x . Существуют и другие процедуры интервалов прогнозирования, даже в нормальном случае: они не единственные.Икс¯ s К Икс
Точно так же существуют интервалы допуска формы
Существуют и другие процедуры интервала допуска : они не единственные.
Отмечая сходство между этими парами формул, мы можем решить уравнение
источник
источник