В течение прошлого года я довольно тесно работал над выборкой важных данных, и у меня есть несколько открытых вопросов, с которыми я надеялся получить некоторую помощь.
Мой практический опыт работы со схемами выборки по важности заключался в том, что они могут иногда давать фантастические оценки с низким отклонением и смещением. Однако чаще они, как правило, дают оценки с высокой ошибкой, которые имеют низкую дисперсию выборки, но очень высокую погрешность.
Мне интересно, может ли кто-нибудь объяснить, какие именно факторы влияют на достоверность выборочных оценок важности? В частности мне интересно:
1) Гарантируются ли оценки выборки важности к правильному результату, когда распределение смещения имеет ту же поддержку, что и исходное распределение? Если так, то почему на практике это занимает так много времени?
2) Существует ли количественная связь между ошибкой в оценке, полученной в результате выборки по важности, и "качеством" распределения смещения (т. Е. Насколько оно соответствует распределению с нулевой дисперсией)
3) Частично основанный на 1) и 2) - есть ли способ количественно определить, «сколько» вы должны знать о распределении, прежде чем вам лучше будет использовать выборочный анализ важности, чем простой метод Монте-Карло.
So, intuitvely, to get small bias and small variance, you wantVarg(ω(X)) to be small and Covg(ω(X),h(X)ω(X)) to be positive. Unfortunately these approximations are not perfect (and accurately determining the variances and covariances is likely to be as difficult as solving the initial problem).
источник