Я очень мало знаю о вероятности и статистике, и я хочу учиться. Я вижу слово «распространение», используемое повсеместно в разных контекстах.
Например, дискретная случайная величина имеет «распределение вероятностей». Я знаю что это. Непрерывная случайная величина имеет функцию плотности вероятности, тогда для интеграл от до функции плотности вероятности является кумулятивной функцией распределения, оцененной в .
И, очевидно, просто «функция распределения» является синонимом «кумулятивной функции распределения», по крайней мере, когда речь идет о непрерывных случайных переменных (вопрос: всегда ли они являются синонимами?).
Тогда есть много известных дистрибутивов. Распределение и т. Д. Но что такое распределение ? Это кумулятивная функция распределения случайной величины ? Или функция плотности вероятности случайной величины ?
Но тогда распределение частот конечного набора данных представляется гистограммой.
Короче говоря: в «Вероятности и статистике», каково определение слова «распределение»?
Я знаю определение распределения в математике (элемент двойственного пространства набора тестовых функций, оснащенных топологией индуктивного предела), но не вероятность и статистика.
источник
Ответы:
Следующее для оценивается случайными переменными. Расширение на другие пространства является прямым, если вы заинтересованы. Я бы сказал, что следующее чуть более общее определение является более интуитивным, чем раздельное рассмотрение функций плотности, массы и кумулятивного распределения.R−
Я включил некоторые математические / вероятностные термины в текст, чтобы сделать его правильным. Если кто-то не знаком с этими терминами, интуиция одинаково хорошо понимается, если просто думать о «борелевских множествах» как о «любом подмножестве о котором я могу думать», а о случайной переменной - численном результате некоторого эксперимента с связанная вероятность.R
Пусть вероятностное пространство и X ( ω ) R - случайная величина , на этом пространстве.(Ω,F,P) X(ω) R−
Функция множества , где представляет собой набор Бореля, называется распределение X .Q(A):=P(ω∈Ω:X(ω)∈A) A X
Словом, распределение говорит вам (грубо говоря), для любого подмножества , вероятность того, что X принимает значение в этом наборе. Можно доказать, что Q полностью определяется функцией F ( x ) : = P ( X ≤ x ) и наоборот. Чтобы сделать это - и я пропускаю детали здесь - построим меру на множествах Бореля, которые присваивают вероятность F ( x ) всем множествам ( - ∞ , x ) и утверждают, что эта конечная мера согласуется с Q наR X Q F(x):=P(X≤x) F(x) (−∞,x) Q система, порождающая борелевскую σ - алгебру.π− σ−
Если это так бывает , что можно записать в виде Q ( ) = ∫ F ( х ) д х , то F является функцией плотности для Q и вы можете увидеть, хотя эта плотность не определяется однозначно (рассмотреть изменения на множества нулевой меры Лебега), то имеет смысл также говорить о е , как распределение X . Обычно, однако, мы называем это функция плотности вероятности X .Q(A) Q(A)=∫Af(x)dx f Q f X X
Аналогично, если так получилось, что можно записать в виде Q ( A ) = ∑ i ∈ A ∩ { … , - 1 , 0 , 1 , … } f ( i ) , то имеет смысл говорить о f как распределение X, хотя мы обычно называем это функцией вероятности массы.Q(A) Q(A)=∑i∈A∩{…,−1,0,1,…}f(i) f X
Таким образом, всякий раз, когда вы читаете что-то вроде « следует равномерному распределению на [ 0 , 1 ] », это просто означает, что функция Q ( A ) , которая сообщает вам вероятность того, что X принимает значения в определенных наборах, характеризуется функция плотности вероятности f ( x ) = I [ 0 , 1 ] или кумулятивная функция распределения F ( x ) = ∫ x - ∞ f ( t )X [0,1] Q(A) X f(x)=I[0,1] .F(x)=∫x−∞f(t)dt
Последнее замечание по случаю, когда нет упоминания случайной величины, а есть только распределение. Можно доказать, что для данной функции распределения (или функции распределения массы, плотности или накопления) существует вероятностное пространство со случайной величиной, которая имеет это распределение. Таким образом, по существу нет никакой разницы в разговоре о распределении или о случайной переменной, имеющей это распределение. Это просто вопрос внимания.
источник
Пусть - вероятностное пространство, ( X , B ) - измеримое пространство, и пусть X : Ω → X - измеримая функция, что означает, что X - 1 ( B ) = { ω : X ( ω ) ∈ B } ∈ F для любого B ∈ B . Распределение X является вероятностная мера μ(Ω,F,P) (X,B) X:Ω→X X−1(B)={ω:X(ω)∈B}∈F B∈B X над ( X , B ) определяется как µ X ( B ) = P ( X ∈ B ) . Когда X = R и B - сигма-поле Бореля, мы называем функцию X случайной «переменной».μX (X,B) μX(B)=P(X∈B) X=R B X
источник
Вопрос и ответы до сих пор, кажется, сосредоточены на теоретических распределениях. Эмпирические распределения обеспечивают более интуитивное понимание распределений.
Экстенсивное определение наблюдаемого распределения - это частота встречаемости для каждого наблюдаемого значения переменной.
В выводной статистике мы затем пытаемся согласовать теоретические распределения с наблюдаемыми распределениями, потому что мы хотели бы работать с предположениями теоретических распределений. Вы можете получить аналогичное определение для теоретических распределений, заменив «наблюдаемое» на «наблюдаемое» или, если быть более точным, «ожидаемое».
источник