Делает ли Wolfram Mathworld ошибку, описывая дискретное распределение вероятностей с помощью функции плотности вероятности?

14

Обычно распределение вероятностей по дискретным переменным описывается с использованием функции вероятности (PMF):

При работе с непрерывными случайными величинами мы описываем распределения вероятностей, используя функцию плотности вероятности (PDF), а не функцию массы вероятности.

- Глубокое обучение от Гудфеллоу, Бенжио и Курвилля

Однако Wolfram Mathworld использует PDF для описания распределения вероятностей по дискретным переменным:

введите описание изображения здесь

Это ошибка? или это не имеет большого значения?

czlsws
источник
5
Это неряшливо, на мой взгляд, но не очень важно. Это даже оправданно, если они подойдут к вероятности с точки зрения теории меры, хотя это немного похоже на введение в подбрасывание монеты. (Как ни странно, у них нет статьи о PMF.)
Дэйв,
9
pmf - плотность против меры подсчета
Сиань
3
Когда вы обсуждаете теорию вероятностей на уровне пространства мер, заданном 3 элементами, pdf и pmf не отличаются друг от друга, поэтому pmf отбрасывается. Все дистрибутивы могут быть указаны в формате PDF. wolfram - это математический сайт, поэтому неудивительно, что они используют математику высокого уровня, чтобы говорить о вероятности. Здесь хорошее свободное чтение. stat.washington.edu/~pdhoff/courses/581/LectureNotes/…
user158565

Ответы:

30

Это не ошибка: в формальной трактовке вероятности с помощью теории меры функция плотности вероятности является производной от интересующей меры вероятности, взятой в отношении «доминирующей меры» (также называемой «эталонной мерой»). Для дискретных распределений по целым числам функция вероятности является функцией плотности по отношению к счетной мере . Поскольку функция вероятности является определенным типом функции плотности вероятности, вы иногда найдете ссылки, подобные этой, которые называют ее функцией плотности, и они не ошибаются, ссылаясь на нее таким образом.

В обычном дискурсе о вероятности и статистике часто избегают этой терминологии и проводят различие между «массовыми функциями» (для дискретных случайных величин) и «плотностными функциями» (для непрерывных случайных величин), чтобы различать дискретные и непрерывные распределения. В других контекстах, где говорится о целостных аспектах вероятности, часто лучше игнорировать это различие и называть оба «функциями плотности».

Восстановить Монику
источник
Спасибо за Ваш ответ. Означает ли treatment«в формальной трактовке вероятности» нотацию, перспективу, соглашение или что-то еще?
czlsws
Когда я говорю здесь о «формальном обращении», я имею в виду современную основу теории вероятностей, которая является подмножеством теории меры. Это математическая теория, которая принята как формальная основа вероятности.
Восстановить Монику
«функция плотности вероятности является производной от интересующей меры вероятности» Мне кажется, что в некотором смысле это скорее «антиинтеграл», чем производная. Существуют разрывные PDF-файлы, такие как равномерное распределение, а дискретные распределения можно рассматривать как суммы дельта-функций Дирака. В этих случаях, чтобы применить его, нужно было бы обобщить концепцию производной, выходящую далеко за рамки обычного понимания.
накопление
@ Накопление - как прерывистое равномерное распределение? ... а теория меры - гораздо более общий подход к интеграции и дифференциации, чем обычное понимание Calc I и II.
jbowman
@ Накопление: Да, это справедливая характеристика, и действительно, это то, что сделано. Технически плотность является производной Радона-Никодима , которая действительно является типом «антиинтеграла» типа, который вы описываете.
Восстановить Монику
5

В дополнение к более теоретическому ответу с точки зрения теории мер также удобно не проводить различий между pmfs и pdfs в статистическом программировании. Например, R имеет множество встроенных дистрибутивов. Для каждого распределения у него есть 4 функции. Например, для нормального распространения (из файла справки):

dnorm gives the density, pnorm gives the distribution function, qnorm gives the quantile function, and rnorm generates random deviates.

Пользователи R быстро стали использовать d,p,q,rпрефиксы. Было бы неприятно, если бы вам пришлось сделать что-то вроде drop dи использовать, mнапример, для биномиального распределения. Вместо этого все так, как ожидал бы пользователь R:

dbinom gives the density, pbinom gives the distribution function, qbinom gives the quantile function and rbinom generates random deviates.
Джон Колман
источник
3
scipy.statsразличает, некоторые объекты имеют pdfметод, а другие имеют pmfметод. Это действительно раздражает меня!
Мэтью Друри