В исследовательской статье об анализе чувствительности модели обыкновенного дифференциального уравнения динамической системы автор представил распределение параметра модели в виде нормального распределения (среднее = 1e-4, std = 3e-5), усеченного до диапазона [0.5e -4 1,5е-4]. Затем он использует образцы из этого усеченного распределения для моделирования модели. Что значит иметь усеченный дистрибутив и образец из этого усеченного дистрибутива?
Я мог бы придумать два способа сделать это:
- Выборка из нормального распределения, но игнорирование всех случайных значений, выходящих за пределы указанного диапазона, до моделирования.
- Каким-то образом получите специальный «усеченный нормальный» дистрибутив и получите образцы из него.
Это действительные и эквивалентные подходы?
Я полагаю, что в первом случае, если построить график экспериментального cdf / pdf образца, он не будет выглядеть как нормальное распределение, поскольку кривые не расширяются до .
qnorm
в цикле R не очень хорошая идея.Этот метод является правильным, но, как упомянул @ Xi'an в своем ответе, потребуется много времени, когда диапазон мал (точнее, когда его мера мала при нормальном распределении).
Имитация усеченного распределения с использованием выборки по важности
After a bit of simplifications, samplingU∼Unif(G(a),G(b)) and taking G−1(U) is equivalent to take tan(U′) with U′∼Unif(arctan(a),arctan(b)) :
Now one has to calculate the weight for each sampled valuexi , defined as the ratio ϕ(x)/g(x) of the two densities up to normalization, hence we can take
The weighted sample(xi,w(xi)) allows to estimate the measure of every interval [u,v] under the target distribution, by summing the weights of each sampled value falling inside the interval:
This provides an estimate of the target cumulative function. We can quickly get and plot it with the
spatsat
package:Of course, the sample(xi) is definitely not a sample of the target distribution, but of the instrumental Cauchy distribution, and one gets a sample of the target distribution by performing weighted resampling, for instance using the multinomial sampling:
Another method: fast inverse transform sampling
Olver and Townsend developed a sampling method for a broad class of continuous distribution. It is implemented in the chebfun2 library for Matlab as well as the ApproxFun library for Julia. I have recently discovered this library and it sounds very promising (not only for random sampling). Basically this is the inversion method but using powerful approximations of the cdf and the inverse cdf. The input is the target density function up to normalization.
The sample is simply generated by the following code:
As checked below, it yields an estimated measure of the interval[2,4] close to the one previously obtained by importance sampling:
источник