С помощью qq-plot можно визуализировать, насколько похожи два распределения (например, визуализировать сходство распределения с нормальным распределением, а также сравнить два распределения произвольных данных). Существуют ли какие-либо статистические данные, которые генерируют более объективную числовую меру, отражающую их сходство (предпочтительно в нормализованной (0 <= x <= 1) форме)? Коэффициент Джини, например, используется в экономике при работе с кривыми Лоренца; есть ли что-то для QQ-графиков?
источник
Недавно я использовал корреляцию между эмпирическим CDF и встроенным CDF для количественной оценки пригодности, и мне интересно, может ли этот подход быть также полезным в текущем случае, который, как я понимаю, включает сравнение двух наборов эмпирических данных. Интерполяция может быть необходима, если между наборами имеется разное количество наблюдений.
источник
Я бы сказал, что более или менее каноническим способом сравнения двух распределений будет критерий хи-квадрат. Однако статистика не нормализуется и зависит от того, как вы выбираете ячейки. Последний пункт, конечно, можно рассматривать как особенность, а не как ошибку: выбор корзин надлежащим образом позволяет, например, более внимательно искать сходство в хвостах, чем в середине распределений.
источник
Довольно прямой мерой «близости» к линейности в графике QQ была бы статистика теста Шапиро-Франции (которая тесно связана с более известным Шапиро-Уилком и может рассматриваться как простое приближение к ней).
Статистика Шапиро-Франсии - это квадратная корреляция между упорядоченными значениями данных и ожидаемой статистикой нормального порядка (иногда обозначаемой как «теоретические квантили») - то есть она должна быть квадратом корреляции, которую вы видите на графике, довольно прямая сводная мера.
(Шапиро-Уилк похож, но учитывает корреляции между статистикой заказов; он аналогичен интерпретации Шапиро-Франции и в равной степени полезен в качестве резюме графика QQ.)
В любом случае, для краткого изложения того, что показывает график QQ, один из них может быть подходящим способом для подведения итогов графика.
источник