Для оценки нормальность не совсем предположение, но основным соображением будет эффективность; во многих случаях хороший линейный оценщик будет работать хорошо, и в этом случае (по Гауссу-Маркову) оценка LS будет лучшей из тех вещей, которые могут быть в порядке. (Если ваши хвосты довольно тяжелые или очень легкие, имеет смысл рассмотреть что-то еще)
В случае тестов и КИ, хотя предполагается нормальность, обычно это не так уж важно (опять же, если хвосты не очень тяжелые или легкие, или, возможно, один из них), в этом, по крайней мере, в не очень Для небольших выборок тесты и типичные КИ, как правило, имеют близкие к своим номинальным свойствам (не слишком далеко от заявленного уровня значимости или охвата) и хорошо работают (разумная мощность для типичных ситуаций или КИ не слишком шире, чем альтернативы) - при перемещении дальше от обычного случая мощность может быть более серьезной проблемой, и в этом случае большие выборки, как правило, не улучшат относительную эффективность, поэтому, если размеры эффекта таковы, что мощность в тесте с относительно хорошей мощностью является средней, она может быть очень плохой для испытаний, которые предполагают нормальность.
Эта тенденция иметь близкие к номинальным свойствам для элементов конфигурации и уровней значимости в тестах объясняется тем, что несколько факторов работают вместе (одним из которых является тенденция линейных комбинаций переменных иметь близкое к нормальному распределению при условии, что задействовано много значений и ни один из них не вносит большой вклад в общую дисперсию).
Однако в случае интервала прогнозирования, основанного на нормальном допущении, нормальность является относительно более критичной, поскольку ширина интервала сильно зависит от распределения одного значения. Тем не менее, даже там, для самого распространенного размера интервала (интервал 95%), тот факт, что многие унимодальные распределения имеют очень близкое к 95% их распределение в пределах примерно 2 секунды от среднего значения, имеет тенденцию приводить к разумной производительности нормального интервала прогнозирования, даже если когда распределение не нормально. [Это не очень хорошо переносится на гораздо более узкие или более широкие интервалы - скажем, интервал 50% или интервал 99,9% - все же.]
2. При прогнозировании отдельных точек данных доверительный интервал вокруг этого прогноза предполагает, что остатки обычно распределяются.
Это не сильно отличается от общего предположения о доверительных интервалах - чтобы быть верным, нам нужно понять распределение, и наиболее распространенным предположением является нормальность. Например, стандартный доверительный интервал вокруг среднего значения работает, поскольку распределение выборочных средних приближается к нормальному, поэтому мы можем использовать распределение z или t
источник