QQ интерпретация сюжета

11

Рассмотрим следующий код и вывод:

  par(mfrow=c(3,2))
  # generate random data from weibull distribution
  x = rweibull(20, 8, 2)
  # Quantile-Quantile Plot for different distributions
  qqPlot(x, "log-normal")
  qqPlot(x, "normal")
  qqPlot(x, "exponential", DB = TRUE)
  qqPlot(x, "cauchy")
  qqPlot(x, "weibull")
  qqPlot(x, "logistic")

введите описание изображения здесь

Похоже, что график QQ для log-normal почти такой же, как график QQ для weibull. Как мы можем их различить? Также, если точки находятся в пределах области, определенной двумя внешними черными линиями, означает ли это, что они следуют указанному распределению?

протон
источник
Я полагаю, что вы используете пакет автомобилей , не так ли? Если это так, вы должны включить это утверждение library(car)в свой код, чтобы людям было легче его соблюдать. В общем, вы также можете установить начальное значение (например, set.seed(1)), чтобы сделать пример воспроизводимым, чтобы каждый мог получить точно такие же данные, которые вы получили, хотя это, вероятно, не так важно здесь.
gung - Восстановить Монику
2
Это не будет работать на моем компьютере, как написано. Например, для qqPlot из пакета car требуется норма для нормальной и lnorm для нормальной. Что мне не хватает?
Том
2
@ Том, я ошибся насчет пакета. Очевидно, это пакет качества инструментов . Более того, пример, похоже, взят отсюда .
gung - Восстановить Монику
Интересной альтернативой является графиком Каллен и Фрей см stats.stackexchange.com/questions/243973/... для примера
Кьетил б Хальворсен

Ответы:

12

Здесь нужно сказать пару вещей:

  1. Форма CDF для логарифмического числа достаточно похожа на форму CDF Вейбулла, чтобы их было сложнее отличить, чем уровень сходства между Вейбуллом и остальными.
  2. внешние черные линии образуют полосу доверия . Использование доверительной полосы в выводе такое же, как и в любой другой стандартной форме статистического вывода для частых. То есть, когда значения попадают в полосу, мы не можем отвергнуть нулевую гипотезу о том, что положенное распределение является правильным. Это не то же самое, что сказать, что мы знаем, что положенное распределение является правильным. (Обратите внимание, что это отличный пример того, что я обсуждал в другом ответе здесь о ситуации, когда фишерианский подход к проверке гипотез был бы предпочтительнее, чем Неймана-Пирсона.)
  3. вам нужно больше данных; Ваш только 20 здесь. N
Gung - Восстановить Монику
источник
Есть ли способы проверки распределения для небольших выборок?
протон
на самом деле кажется, что точки лежат в доверительных полосах для всех распределений. Таким образом, мы не можем различить распределения?
протон
1
Существуют тесты на пригодность набора данных к теоретическому распределению, но я склонен думать, что они уступают qq-графикам. По сути, вы не сможете различить эти распределения с . Если вы думаете об этом с точки зрения статистической мощности, ваша способность отклонять каждое из ложных нулей здесь составляет . Это может помочь вам прочитать ответ, который я связал в пункте № 2. 5 %n=205%
gung - Восстановить Монику
2
+1 на маленький размер выборки. Использование 300 образцов поможет многое различить. Протон: Нет, вы не можете отличить распределения с небольшой выборкой. Как ты мог? Это все равно что пытаться идентифицировать лицо с 20 пикселями.
Уэйн
3

Похоже, что график QQ для log-normal почти такой же, как график QQ для weibull.

Да.

Как мы можем их различить?

При таком размере выборки вы, скорее всего, не сможете.

Также, если точки находятся в пределах области, определенной двумя внешними черными линиями, означает ли это, что они следуют указанному распределению?

Нет. Это только означает, что вы не можете сказать, что распределение данных отличается от этого распределения. Это отсутствие доказательств различия, а не доказательство отсутствия различий.

Вы можете быть почти уверены, что данные взяты из дистрибутива, который не относится ни к одному из рассмотренных вами (почему это будет именно из любого из них?).

Glen_b - Восстановить Монику
источник
Как выражение: «Это отсутствие доказательств различий, а не доказательств отсутствия различий».
jlandercy