Обычно распределение вероятностей по дискретным переменным описывается с использованием функции вероятности (PMF):
При работе с непрерывными случайными величинами мы описываем распределения вероятностей, используя функцию плотности вероятности (PDF), а не функцию массы вероятности.
- Глубокое обучение от Гудфеллоу, Бенжио и Курвилля
Однако Wolfram Mathworld использует PDF для описания распределения вероятностей по дискретным переменным:
Это ошибка? или это не имеет большого значения?
Ответы:
Это не ошибка: в формальной трактовке вероятности с помощью теории меры функция плотности вероятности является производной от интересующей меры вероятности, взятой в отношении «доминирующей меры» (также называемой «эталонной мерой»). Для дискретных распределений по целым числам функция вероятности является функцией плотности по отношению к счетной мере . Поскольку функция вероятности является определенным типом функции плотности вероятности, вы иногда найдете ссылки, подобные этой, которые называют ее функцией плотности, и они не ошибаются, ссылаясь на нее таким образом.
В обычном дискурсе о вероятности и статистике часто избегают этой терминологии и проводят различие между «массовыми функциями» (для дискретных случайных величин) и «плотностными функциями» (для непрерывных случайных величин), чтобы различать дискретные и непрерывные распределения. В других контекстах, где говорится о целостных аспектах вероятности, часто лучше игнорировать это различие и называть оба «функциями плотности».
источник
treatment
«в формальной трактовке вероятности» нотацию, перспективу, соглашение или что-то еще?В дополнение к более теоретическому ответу с точки зрения теории мер также удобно не проводить различий между pmfs и pdfs в статистическом программировании. Например, R имеет множество встроенных дистрибутивов. Для каждого распределения у него есть 4 функции. Например, для нормального распространения (из файла справки):
Пользователи R быстро стали использовать
d,p,q,r
префиксы. Было бы неприятно, если бы вам пришлось сделать что-то вроде dropd
и использовать,m
например, для биномиального распределения. Вместо этого все так, как ожидал бы пользователь R:источник
scipy.stats
различает, некоторые объекты имеютpdf
метод, а другие имеютpmf
метод. Это действительно раздражает меня!