Y1, Y2, … , YN∈ R
Если вы используете нормальное распределение для моделирования ваших данных, вы, вероятно, напишите, что
Yя∼ N( μ , σ2)
μσ
Но допустим, что ваши данные являются данными подсчета и, следовательно, обычно не распространяются. Это даже не непрерывно в этом случае, поэтому вы можете использовать вместо этого распределение Пуассона:
Yя∼ Pо я ы ы ö п ( λ )
λE [ Yя] = λВa r [ Yя] = λ
Поэтому люди добавляют параметр дисперсии, чтобы получить дополнительную степень свободы в моделировании среднего значения и дисперсии одновременно. Я думаю, что любой учебник по GLM даст вам более подробное и математическое объяснение того, что это такое, но мотивация, я полагаю, довольно проста, как это.