У меня есть данные о том, сколько пользователей публикуют сколько вопросов. Например,
[UserCount, QuestionCount]
[2, 100]
[9, 10]
[3, 80]
... ...
Это означает, что 2 пользователя разместили по 100 вопросов, 9 пользователей - по 10 вопросов и т. Д. Итак, как я могу определить, UserCount, QuestionCount
следует ли распределение степенному закону?
Я нашел пакет PoweRlaw . Тем не менее, я могу пройти только одну группу чисел, чтобы сделать оценку. (Примером, представленным в этом пакете, является частота слова.) Так как мне использовать этот пакет? Или у меня что-то не так? У меня также есть данные подсчета вопрос каждого пользователя, то есть [100, 100, 10, 10, 10 ... ]
. Если я передам эти данные в пакет, что я получу?
r
hypothesis-testing
goodness-of-fit
power-law
tThirday
источник
источник
Ответы:
Согласно Clauset et al., Вы тестируете хвост степенного закона с помощью
poweRlaw
пакета:последние две строки можно переписать как одну строку
Также в этот момент вы можете увидеть статистику KS:
Это может занять некоторое время, так что иди и возьми чашку чая ...
poweRlaw
compare_distributions
comp
comp$test_statistic
data_pl
comp$p_two_side
Повторите этот шаг
disexp
,dispois
классы для сравнения степенного с этими альтернативами.источник
data("moby")
и использоватьmoby
вместоdata