У меня есть выборка населения зарегистрированных максимумов амплитуды сигнала. Население составляет около 15 миллионов образцов. Я составил гистограмму населения, но не могу угадать распределение с такой гистограммой.
EDIT1: файл с необработанными значениями образца находится здесь: необработанные данные
Может ли кто-нибудь помочь оценить распределение по следующей гистограмме:
distributions
histogram
mbaitoff
источник
источник
Ответы:
Используйте fitdistrplus:
Вот ссылка CRAN на fitdistrplus.
Вот старая ссылка виньетки для fitdistrplus.
Если ссылка виньетки не работает, выполните поиск «Использование библиотеки fitdistrplus, чтобы указать распределение из данных».
Виньетка хорошо объясняет, как использовать пакет. Вы можете посмотреть, как различные дистрибутивы подходят за короткий промежуток времени. Это также производит Диаграмму Каллена / Фрея.
источник
plotdist
comamnd? Как я могу получить диаграмму Каллена / Фрея?descdist()
. Я обновил вышеупомянутый пост, чтобы включить некоторый код и ссылку на старую виньетку. Я не мог заставить вышеупомянутую ссылку виньетки работать. Итак, гугл следующее: «Использование библиотеки fitdistrplus для указания распределения по данным». Это файл .pdf.f1g <- fitdist(x1, "gamma")
соответствует гамма-распределению исходным даннымx1
и сохраняет его вf1g
. Верхний левый графикplot(f1g)
показывает гистограмму для исходных данных вx1
виде столбцов, а график зависимости плотности гамма-излучения отf1g
сплошной линии. График плотности (сплошная линия) рисуется на гистограмме как показатель того, насколько хорошо «подгонка» представляет данные.Тогда вы, скорее всего, сможете отклонить любое конкретное распространение простой закрытой формы.
Даже этого крошечного выпуклости слева от графика, вероятно, будет достаточно, чтобы заставить нас сказать «явно не такой-то и такой-то».
С другой стороны, он, вероятно, довольно хорошо аппроксимируется рядом распространенных дистрибутивов; очевидными кандидатами являются такие вещи, как логнормальное и гамма, но есть множество других. Если вы посмотрите на журнал переменной x, вы, вероятно, сможете решить, будет ли нормальный логарифм нормальным (после регистрации журналов гистограмма должна выглядеть симметрично).
Если журнал отклонен влево, подумайте, в порядке ли Гамма, если он наклонен вправо, подумайте, в порядке ли обратная гамма или (еще более асимметричная) обратная гауссова. Но это упражнение - скорее поиск дистрибутива, достаточно близкого для жизни; ни одно из этих предложений на самом деле не имеет всех функций, которые там присутствуют.
Если у вас есть какая-либо теория в поддержку выбора, отбросьте всю эту дискуссию и используйте ее.
источник
Я не уверен, почему вы хотите классифицировать выборку для конкретного распределения с таким большим размером выборки; экономно, сравнивая его с другим образцом, ища физическую интерпретацию параметров?
Большинство статистических пакетов (R, SAS, Minitab) позволяют отображать данные на графике, который дает прямую линию, если данные поступают из определенного распределения. Я видел графики, которые дают прямую линию, если данные нормальные (логарифмически нормальные - после логарифмического преобразования), Вейбулл и хи-квадрат сразу приходят ко мне. Этот метод позволит вам увидеть выбросы и даст вам возможность указать причины, по которым точки данных являются выбросами. В R нормальный вероятностный график называется qqnorm.
источник