Как я могу доказать, что данные эксперимента соответствуют распределению тяжелых хвостов?

9

У меня есть несколько результатов теста задержки ответа сервера. Согласно нашему теоретическому анализу, распределение задержки (функция распределения вероятности задержки ответа) должно иметь поведение с тяжелым хвостом. Но как я могу доказать, что результат теста соответствует распределению тяжелых хвостов?

Geni
источник

Ответы:

12

Я не уверен, правильно ли я интерпретирую ваш вопрос, поэтому дайте мне знать, и я мог бы адаптировать или удалить этот ответ. Во-первых, мы не доказываем, что касается наших данных, мы просто показываем, что что-то не является необоснованным. Это можно сделать несколькими способами, одним из которых является статистическое тестирование. Однако, по моему мнению, если у вас есть заранее заданное теоретическое распределение, лучший подход - это просто построить qq-график . Большинство людей считают, что qq-графики используются только для оценки нормальности, но вы можете построить эмпирические квантили против любого теоретического распределения, которое можно указать. Если вы используете R, у автомобильного пакета есть расширенная функция qq.plot ()с множеством приятных функций; два, которые мне нравятся, это то, что вы можете указать ряд различных теоретических распределений помимо гауссовского (например, вы могли бы tиспользовать альтернативу с более быстрым хвостом), и что он строит 95% доверительный интервал. Если у вас нет определенного теоретического распределения, но вы просто хотите увидеть, являются ли хвосты более тяжелыми, чем ожидалось от нормального, это можно увидеть на qq-графике, но иногда бывает трудно распознать. Одна возможность, которая мне нравится, это создать график плотности ядра, а также график qq, и вы можете наложить на него нормальную кривую для загрузки. Основной код R есть plot(density(data)). Для числа вы можете рассчитать эксцесси посмотреть, если это выше, чем ожидалось. Я не знаю о консервативных функциях для эксцесса в R, вы должны кодировать его, используя уравнения, приведенные на связанной странице, но это не сложно сделать.

Gung - Восстановить Монику
источник
5
+1 Хороший совет и хорошая дискуссия. Но нижний эксцесс? Разве вы не имеете в виду выше? Вы можете поэкспериментировать (в R) с library(moments); apply(matrix(1:5,5,1), 1, function(p) kurtosis((1:100)^p)): обратите внимание, как увеличивается куртоз, когда правый хвост растягивается под действием более высоких сил.
whuber
К сожалению. @whuber, спасибо за улов. Я отредактировал ответ.
gung - Восстановить Монику
2
мы не доказываем что-то [...], мы просто показываем, что что-то не является необоснованным. Предложение процитировать!
Симона
Пакет e1071 также содержит kurtosisфункцию, которую вы можете использовать здесь.
Кит Хьюджит