Я читал здесь , что данный образец из непрерывного распределения с cdf , выборка, соответствующая следует стандартному равномерному распределению.
Я проверил это, используя качественное моделирование в Python, и мне было легко проверить связь.
import matplotlib.pyplot as plt
import scipy.stats
xs = scipy.stats.norm.rvs(5, 2, 10000)
fig, axes = plt.subplots(1, 2, figsize=(9, 3))
axes[0].hist(xs, bins=50)
axes[0].set_title("Samples")
axes[1].hist(
scipy.stats.norm.cdf(xs, 5, 2),
bins=50
)
axes[1].set_title("CDF(samples)")
В результате получается следующий сюжет:
Я не могу понять, почему это происходит. Я предполагаю, что это связано с определением CDF и его отношением к PDF, но я что-то упустил ...
Я был бы признателен, если бы кто-то мог указать мне на чтение по этой теме или помочь мне получить некоторую интуицию по этому вопросу.
РЕДАКТИРОВАТЬ: CDF выглядит следующим образом:
Ответы:
Предположим, что непрерывно и возрастает. Определите Z = F X ( X ) и обратите внимание, что Z принимает значения в [ 0 , 1 ] . Тогда F Z ( x ) = P ( F X ( X ) ≤ x ) = P ( X ≤ F - 1 X ( x ) ) = F X ( F -FX Z=FX(X) Z [0,1]
С другой стороны, если является равномерной случайной величиной, которая принимает значения в [ 0 , 1 ] , F U ( x ) = ∫ R f U ( u )U [0,1]
Таким образом, для любого x ∈ [ 0 , 1 ] .FZ(x)=FU(x) x∈[0,1]
источник
источник