Я узнаю об эмпирической функции кумулятивного распределения. Но я все еще не понимаю
Почему это называется «Эмпирический»?
Есть ли разница между Эмпирическим CDF и CDF?
distributions
terminology
cdf
ecdf
Gammaries
источник
источник
Ответы:
ПустьX - случайная величина.
Различие заключается в том, какая мера вероятности используется. Для эмпирического CDF вы используете меру вероятности, определенную частотой в эмпирической выборке.
Простой пример (подбрасывание монеты):
ПустьX - случайная величина, обозначающая результат броска одной монеты, где X=1 обозначает головы, а X=0 обозначает хвосты.
CDF для честной монеты определяется как:F(x)=⎧⎩⎨⎪⎪0121for x<0for 0≤x<1for 1≤x
Если бы вы перевернули 2 головы и 1 хвост, эмпирический CDF будет:G(x)=⎧⎩⎨⎪⎪0231for x<0for 0≤x<1for 1≤x
Эмпирический CDF будет отражать , что в вашей выборке,2/3 ваших перестроек были головами.
Другой пример (F - CDF для нормального распределения):
ПустьX - нормально распределенная случайная величина со средним значением 0 и стандартным отклонением 1 .
CDF предоставляется:
При достаточном количестве розыгрышей IID (и соблюдении определенных условий регулярности) эмпирический CDF будет сходиться к базовому CDF популяции.
источник
Да, они разные. Эмпирический cdf - это правильный cdf, но эмпирические cdf всегда будут дискретными, даже если они не взяты из дискретного распределения, в то время как cdf распределения может быть другим, помимо дискретного.
Если вы рассматриваете выборку так, как если бы она была совокупностью значений, каждая из которых одинаково вероятна (т. Е. Поместите вероятность 1 / n в каждое наблюдение), тогда cdf этого распределения будет ECDF данных.
Это оценка численности населения в формате cdf на основе выборки; в частности, если вы относитесь к пропорциям выборки при каждом отдельном значении данных и относитесь к нему как к вероятности в популяции, вы получаете ECDF.
Эмпирическое имеет значение что-то вроде «наблюдением, а не теорией», и это именно то, что оно означает в данном случае ... использование наблюдений для определения функции распределения.
источник
Эмпирический CDF построен на основе фактического набора данных (на графике ниже я использовал 100 выборок из стандартного нормального распределения). CDF - это теоретическая конструкция - это то, что вы бы увидели, если бы могли брать бесконечно много сэмплов.
Эмпирический CDF обычно очень хорошо аппроксимирует CDF, особенно для больших выборок (на самом деле существуют теоремы о том, как быстро он сходится к CDF при увеличении размера выборки).
источник
Эмпирический это то, что вы строите из данных и наблюдений. Например, предположим, что вы хотите знать о распределении роста людей в стране. Вы начинаете с измерения людей и получаете гистограмму, которая может быть приближена к распределению. Затем вы рассчитываете эмпирический CDF.
Если вы используете статистическое распределение (детерминированная формула, которая дает точно такой же результат с теми же параметрами), вы также можете рассчитать его CDF.
Вы можете сказать: «Рост людей в этой стране распределен аналогично нормальному распределению со средним 1,75 м и стандартным отклонением 0,1 м. Тогда вы можете использовать CDF ~N( μ = 1,75 м , σ = 0,1 м ) вместо построенного CDF эмпирического распределения.
источник
Согласно Dictionary.com , определения «эмпирические» включают в себя:
Следовательно, Empirical CDF - это CDF, который вы получаете из ваших данных. Это контрастирует с теоретическим CDF (часто называемым просто «CDF»), который получается из статистической или вероятностной модели, такой как нормальное распределение.
источник