Что именно является дистрибутивом?

16

Я очень мало знаю о вероятности и статистике, и я хочу учиться. Я вижу слово «распространение», используемое повсеместно в разных контекстах.

Например, дискретная случайная величина имеет «распределение вероятностей». Я знаю что это. Непрерывная случайная величина имеет функцию плотности вероятности, тогда для интеграл от до функции плотности вероятности является кумулятивной функцией распределения, оцененной в .xRxx

И, очевидно, просто «функция распределения» является синонимом «кумулятивной функции распределения», по крайней мере, когда речь идет о непрерывных случайных переменных (вопрос: всегда ли они являются синонимами?).

Тогда есть много известных дистрибутивов. Распределение и т. Д. Но что такое распределение ? Это кумулятивная функция распределения случайной величины ? Или функция плотности вероятности случайной величины ?Γχ2ΓΓΓ

Но тогда распределение частот конечного набора данных представляется гистограммой.

Короче говоря: в «Вероятности и статистике», каково определение слова «распределение»?

Я знаю определение распределения в математике (элемент двойственного пространства набора тестовых функций, оснащенных топологией индуктивного предела), но не вероятность и статистика.

danzibr
источник
1
Соответствующая статья в Википедии, кажется, является достойным введением в тему.
Александр Блех
1
Строго говоря, «распределение» и «cdf» следует рассматривать как синонимы, но «распределение» часто используется в гораздо более слабом смысле и часто используется для обозначения плотности / pmf.
Glen_b
3
Ваше понимание распределения довольно близко к вероятности; Основное различие заключается в том, что те, кто в вероятности, обладают некоторыми дополнительными свойствами (быть положительными и нормализованными к единству). Связь заключается в том, что ваше определение устанавливает распределение в терминах связанного оператора ожидания. Существует также (серьезное) злоупотребление языком в статистике, которое также называет параметризованное семейство распределений «распределением». Наконец, любой конечный набор данных определяет распределение, полученное путем выборки из него, его «эмпирическое распределение».
whuber
@whuber Это помогает, в частности, благодаря злоупотреблению языком. Это все равно что вызывать неопределенный интеграл функции ... функции.
Данзибр
Аналогичный вопрос с хорошими ответами: stats.stackexchange.com/questions/210403/…
kjetil b halvorsen

Ответы:

7

Следующее для оценивается случайными переменными. Расширение на другие пространства является прямым, если вы заинтересованы. Я бы сказал, что следующее чуть более общее определение является более интуитивным, чем раздельное рассмотрение функций плотности, массы и кумулятивного распределения.R

Я включил некоторые математические / вероятностные термины в текст, чтобы сделать его правильным. Если кто-то не знаком с этими терминами, интуиция одинаково хорошо понимается, если просто думать о «борелевских множествах» как о «любом подмножестве о котором я могу думать», а о случайной переменной - численном результате некоторого эксперимента с связанная вероятность.R


Пусть вероятностное пространство и X ( ω ) R - случайная величина , на этом пространстве.(Ω,F,P)X(ω)R

Функция множества , где представляет собой набор Бореля, называется распределение X .Q(A):=P(ωΩ:X(ω)A)AX

Словом, распределение говорит вам (грубо говоря), для любого подмножества , вероятность того, что X принимает значение в этом наборе. Можно доказать, что Q полностью определяется функцией F ( x ) : = P ( X x ) и наоборот. Чтобы сделать это - и я пропускаю детали здесь - построим меру на множествах Бореля, которые присваивают вероятность F ( x ) всем множествам ( - , x ) и утверждают, что эта конечная мера согласуется с Q наRXQF(x):=P(Xx)F(x)(,x)Q система, порождающая борелевскую σ - алгебру.πσ

Если это так бывает , что можно записать в виде Q ( ) = F ( х ) д х , то F является функцией плотности для Q и вы можете увидеть, хотя эта плотность не определяется однозначно (рассмотреть изменения на множества нулевой меры Лебега), то имеет смысл также говорить о е , как распределение X . Обычно, однако, мы называем это функция плотности вероятности X .Q(A)Q(A)=Af(x)dxfQfXX

Аналогично, если так получилось, что можно записать в виде Q ( A ) = i A { , - 1 , 0 , 1 , } f ( i ) , то имеет смысл говорить о f как распределение X, хотя мы обычно называем это функцией вероятности массы.Q(A)Q(A)=iA{,1,0,1,}f(i)fX

Таким образом, всякий раз, когда вы читаете что-то вроде « следует равномерному распределению на [ 0 , 1 ] », это просто означает, что функция Q ( A ) , которая сообщает вам вероятность того, что X принимает значения в определенных наборах, характеризуется функция плотности вероятности f ( x ) = I [ 0 , 1 ] или кумулятивная функция распределения F ( x ) = x - f ( t )X[0,1]Q(A)Xf(x)=I[0,1] .F(x)=xf(t)dt

Последнее замечание по случаю, когда нет упоминания случайной величины, а есть только распределение. Можно доказать, что для данной функции распределения (или функции распределения массы, плотности или накопления) существует вероятностное пространство со случайной величиной, которая имеет это распределение. Таким образом, по существу нет никакой разницы в разговоре о распределении или о случайной переменной, имеющей это распределение. Это просто вопрос внимания.

ekvall
источник
3

Пусть - вероятностное пространство, ( X , B ) - измеримое пространство, и пусть X : Ω X - измеримая функция, что означает, что X - 1 ( B ) = { ω : X ( ω ) B } F для любого B B . Распределение X является вероятностная мера μ(Ω,F,P)(X,B)X:ΩXX1(B)={ω:X(ω)B}FBB X над ( X , B ) определяется как µ X ( B ) = P ( X B ) . Когда X = R и B - сигма-поле Бореля, мы называем функцию X случайной «переменной».μX(X,B)μX(B)=P(XB)X=RBX

Zen
источник
1
должно быть очень понятным людям с небольшим знанием вероятности и статистики :)
Алексей Григорьев
3
Хорошо, ОП, кажется, знает продвинутые математические вещи, такие как «элемент двойственного пространства совокупности тестовых функций, оснащенных топологией индуктивного предела». Проверьте конец его вопроса.
Дзен
2
Это был действительно хороший ответ для меня. Мне нужно было проверить определение вероятностного пространства, но для человека с математическим прошлым это было понятно. Я оценил краткость ответа, только не принимая его из-за деталей в другом ответе.
Данзибр
1

Вопрос и ответы до сих пор, кажется, сосредоточены на теоретических распределениях. Эмпирические распределения обеспечивают более интуитивное понимание распределений.

пример

Во время классного турнира по скакалке мы наблюдаем всех детей в классе скакалкой. Первый ребенок может прыгать дважды, второй - четыре раза, следующий - пятнадцать раз и т. Д. Мы записываем количество прыжков. Пятеро из детей прыгали по восемь раз каждый, но только один из них прыгнул дважды. Мы говорим, что прыжки в восемь раз распределены по-другому, чем прыжки в два раза.

Экстенсивное определение наблюдаемого распределения - это частота встречаемости для каждого наблюдаемого значения переменной.

В выводной статистике мы затем пытаемся согласовать теоретические распределения с наблюдаемыми распределениями, потому что мы хотели бы работать с предположениями теоретических распределений. Вы можете получить аналогичное определение для теоретических распределений, заменив «наблюдаемое» на «наблюдаемое» или, если быть более точным, «ожидаемое».

ноуменальное
источник