Являются ли CDF более фундаментальными, чем PDF?

43

Мой проф проф в основном сказал, если дать один из следующих трех, вы можете найти два других:

  • Кумулятивная функция распределения
  • Функция генерирования момента
  • Функция плотности вероятности

Но мой профессор по эконометрике сказал, что CDF являются более фундаментальными, чем PDF, потому что есть примеры, где вы можете иметь CDF, но PDF не определен.

Являются ли CDF более фундаментальными, чем PDF? Как мне узнать, можно ли получить PDF или MGF из CDF?

Стэн Шунпайк
источник
23
Это какой-то фундаментальный конкурс? У нас есть группа судей знаменитостей? Все эти три понятия могут быть использованы для определения меры в пространстве . Однако для данного ВПР, MGF , и в формате PDF может не существовать, как и в формате PDF определен как производное CDF и ФМГ определяется как R ехр ( т х ) г F ( х ) , и этот интеграл не существует необходимости. Однако это не означает, что любое из этих понятий является менее фундаментальным. Фундаментальный - это хорошее прилагательное, у которого нет математического определения. Это синоним важного. рdрехр(TИкс)dF(Икс)
mpiktas
6
@mpiktas: Каждое распределение вероятностей на (подмножестве) имеет CDF, и оно однозначно определяет распределение. Однако не все вероятностные распределения имеют PDF или MGF (но все они имеют характеристическую функцию ). RN
Ильмари Каронен
3
@mpiktas Вы можете сделать это с на R . Тогда P ( ( - , x ] ) не определено. Тем не менее мне совершенно ясно, почему профессор использовал выражение «более фундаментальный». Прилагательное может не иметь четкого математического значения, но что же? Я говорю (некоторые ) Английский тоже. Каждый PDF-файл, о котором мы знаем, имеет базовый CDF. Здесь «базовый» имеет хорошую связь с «фундаментальным». Обратное неверно.Aзнак равно{р,}рп((-,Икс])
drhab
2
@drhab, естественно, я говорил о производной Радона-Никодима :) Я тоже прекрасно понимаю, что имел в виду профессор, но, по-моему, опасно использовать такие выражения со студентами, потому что тогда вместо того, чтобы пытаться понять разницу между математические понятия они пытаются ранжировать их в соответствии с фундаментальностью, что в корне неверно. Пун намеревался.
mpiktas
4
@mpiktas: конечно, нет точного определения понятия «фундаментальный». Но есть большая золотая середина между «строго определенным» и «абсолютно бессмысленным». В самой нашей математике, конечно, все в конечном итоге должно быть абсолютно строгим, поэтому мы очень привыкли отбрасывать все, что не является. Но когда мы говорим и думаем о математике, мы имеем субъективные, но значимые понятия, такие как «фундаментальный», «общий» и т. Д., Как и все остальные; и это нормально.
PLL

Ответы:

69

Каждое распределение вероятностей на (подмножестве) имеет кумулятивную функцию распределения , и оно однозначно определяет распределение. Таким образом, в этом смысле CDF действительно столь же фундаментален, как и сам дистрибутив.рN

Однако функция плотности вероятности существует только для (абсолютно) непрерывных распределений вероятностей . Простейшим примером распределения, в котором отсутствует PDF, является любое дискретное распределение вероятностей , такое как распределение случайной величины, которая принимает только целые значения.

Конечно, такие дискретные распределения вероятностей могут характеризоваться функцией вероятностной массы , но есть также распределения, которые не имеют ни PDF, ни PMF, такие как любая смесь непрерывного и дискретного распределения:

Диаграмма непрерывного, дискретного и смешанного распределения вероятностей
(Схема бесстыдно украдена из ответа Glen_b на связанный вопрос.)

Есть даже сингулярные распределения вероятностей , такие как распределение Кантора , которые не могут быть описаны даже комбинацией PDF и PMF. Такие дистрибутивы все еще имеют четко определенный CDF. Например, вот CDF распределения Кантора, также иногда называемый «лестницей дьявола»:

Канторская раздача CDF
( Изображение из Wikimedia Commons от пользователей Theon и Amirki , используется по лицензии CC-By-SA 3.0 .)

CDF, известный как функция Кантора , является непрерывным, но не абсолютно непрерывным. Фактически, она постоянна везде, кроме множества Кантора с нулевой мерой Лебега, но все еще содержит бесконечно много точек. Таким образом, вся масса вероятности распределения Кантора сосредоточена на этом исчезающе малом подмножестве линии действительных чисел, но каждая точка в множестве по-прежнему индивидуально имеет нулевую вероятность.


Есть также распределения вероятностей, которые не имеют функции, генерирующей момент . Вероятно, наиболее известным примером является распределение Коши, распределение с хвостами, у которого нет четко определенных моментов порядка 1 или выше (таким образом, в частности, нет четко определенного среднего или дисперсии!).

Однако все вероятностные распределения на имеют (возможно комплексную) характеристическую функцию ), определение которой отличается от определения MGF только умножением на мнимую единицу . Таким образом, характеристическая функция может рассматриваться как основополагающая как CDF.рN

Илмари Каронен
источник
Вы говорите, что у каждого дистрибутива есть CDF, но не у каждого есть PDF, но на самом деле есть дистрибутивы, которые имеют PDF и не имеют CDF замкнутой формы, например, многомерный нормальный.
Тим
13
@Tim: Это правда, но только с квалификатором «закрытая форма»; CDF все еще существует, даже если мы не можем написать его в закрытом виде. И в любом случае, определение « выражения закрытой формы » общеизвестно нечетко; по некоторым строгим определениям, даже одномерное нормальное распределение не имеет CDF замкнутой формы, но если вы считаете функцию ошибки замкнутой формой, это так.
Ильмари Каронен
11
@Tim Это не контрпример. Это произвольное свойство, которое вы выбрали как важное / фундаментальное для вас. Для меня свойство «существует» важнее, чем «имеет закрытую форму». Более того, «всегда существует» по сравнению с «иногда может не иметь закрытой формы, как любая функция».
Арк-кун
3
[0,1]р
1
@ Арк-кун Я играю здесь адвоката дьяволов, поскольку есть случаи, когда PDF - это нечто более «доступное», чем CDF. Мне нравится этот ответ (+1), но ИМХО, это то, что также можно упомянуть.
Тим
16

Я полагаю, что ваш профессор по эконометрике думал что-то вроде следующего.

F[0,1]

F(Икс)знак равно12Икс для Икс<12
F(Икс)знак равно12Икс+12 для Икс12

[0,1]

п({12})знак равно12

е

е

По определению PDF мы должны иметь

0Иксе(T)dTзнак равноF(Икс)-F(0)знак равно14Икс

0<Икс<12

е(Икс)знак равно14 для Икс<12

Икс>12

е(Икс)знак равно14 для Икс>12

ее(12)е(12)

п({12})знак равно12

нам нужно

12-ε12+εе(T)dT>12

12

12-ε12+εе(T)dTзнак равно12-ε12+ε14dTзнак равно12ε

е

Вы можете восстановить дух PDF, но вы должны использовать более сложные математические объекты, либо меру, либо распределение .

Мэтью Друри
источник
3
12δ(Икс-12)δ(Икс)Иксзнак равно0
-+δ(Икс)dИксзнак равно1
2
L1
@IwillnotexistIdonotexist То, что сказал Уубер, - это то, на что я намекал в последней строке. Я использовал слово «распространение».
Мэтью Друри
4
1/21/2
4

Илмари дает хороший ответ с теоретической точки зрения. Однако можно также спросить, для каких целей плотность (pdf) и функция распределения (pdf) служат для практических расчетов. Это может прояснить, для каких ситуаций одна из них более полезна, чем другая.

р(-,Икс]--

Однако плотность важна для статистики, так как вероятность определяется в терминах плотности. Таким образом, если мы хотим вычислить оценку максимального правдоподобия, нам напрямую нужна плотность.

Если мы обратимся к сравнению эмпирического и теоретического распределения, оба могут быть полезны, но методы, такие как pp- и qq-графики, основанные на функции распределения, часто являются предпочтительными.

рdd2

NRH
источник