Интеграция Монте-Карло для не квадратично интегрируемых функций

Я надеюсь, что это правильное место, чтобы спросить, если не стесняйтесь перенести его на более подходящий форум.

Я довольно долго размышлял о том, как обрабатывать неквадратные интегрируемые функции с помощью интеграции Монте-Карло. Я знаю, что MC все еще дает правильную оценку, но ошибка нереальна (расходится?) Для такого рода функций.

Давайте ограничим нас одним измерением. Интеграция Монте-Карло означает, что мы приближаем интеграл

I = \int_{0}^{1} d x f (x)

$I = \int_0^1 \mathrm{d}x \, f(x)$

используя оценку

E = \frac{1}{N} \sum_{i = 1}^{N} f (x_{i})

$E = \frac{1}{N} \sum_{i=1}^N f(x_i)$

с равномерно распределенными случайными точками. Закон больших чисел гарантирует, что . Выборочная дисперсия $x_i \in [0,1]$ $E \approx I$

S^{2} = \frac{1}{N - 1} \sum_{i = 1}^{N} (f (x_{i}) - E)^{2}

$S^2 = \frac{1}{N-1} \sum_{i=1}^N (f (x_i) - E)^2$

аппроксимирует дисперсию распределения, индуцированного . Однако, если не является квадратично интегрируемым, т.е. интеграл от квадрата функции расходится, это подразумевает $\sigma^2$ $f$ $f$

σ^{2} = \int_{0}^{1} d x {(f (x) - I)}^{2} = \int_{0}^{1} d x f^{2} (x) - I^{2} ⟶ \infty

$\sigma^2 = \int_0^1 \mathrm{d} x \, \left( f(x) - I \right)^2 = \int_0^1 \mathrm{d} x \, f^2(x) - I^2 \longrightarrow \infty$

Это означает, что дисперсия также расходится.

Простой пример - функция

f (x) = \frac{1}{\sqrt{x}}

$f(x) = \frac{1}{\sqrt{x}}$

для которого и . $I = \int_0^1 \mathrm{d}x \, \frac{1}{\sqrt{x}} = 2$ $\sigma^2 = \int_0^1 \mathrm{d}x \, \left( \frac{1}{x} - 2 \right) = \left[ \ln x - 2x \right]_0^1 \rightarrow \infty$

Если конечно, можно приблизить ошибку среднего помощью , но что если не является квадратично интегрируемым? $\sigma^2$ $E$ $\frac{S}{\sqrt{N}} \approx \frac{\sigma}{\sqrt{N}}$ $f(x)$

monte-carlo numerical-integration cschwan
источник

Я не понимаю: вы начинаете с того, что что ни один из имеет дисперсии, а затем спрашиваете, будет ли дисперсия их среднего значения разумной оценкой этой несуществующей дисперсии! Или я неправильно понял этот вопрос: возможно, под «статистически независимыми оценками» вы имеете в виду какую-то другую (возможно, надежную) оценку интеграла?

E_{i}

$E_i$

whuber

Я не говорил, что не имеет дисперсии, только то, что я не могу определить для нее дисперсию с помощью . Таким образом, вопрос , могу ли я определить ошибку на всех , и если является разумным кандидатом. Под статистически независимым я подразумеваю, что получаются с использованием разных случайных чисел, например, с использованием генераторов случайных чисел с разным семенем (надеюсь, тогда это правильный термин).

E

$E$

S^{2}

$S^2$

{\bar{S}}^{2}

$\bar{S}^2$

E_{i}

$E_i$

cschwan

Пожалуйста, объясните, что вы имеете в виду, не имея возможности «определить дисперсию для нее с помощью ». Я не могу понять это, используя стандартные определения дисперсии и .

S^{2}

$S^2$

S^{2}

$S^2$

whuber

Ну, функция не является квадратично интегрируемой, поэтому, если я не ошибаюсь, должно расходиться . Если это так, то определение не имеет смысла, не так ли? Однако с помощью центральной предельной теоремы все равно будет сходиться к истинному значению интеграла, но без ошибки само по себе это значение не имеет смысла (насколько «хорош» этот результат?).

S^{2}

$S^2$

S^{2}

$S^2$

E

$E$

cschwan

Извините, я хотел сказать «закон больших чисел», конечно, не CLT.

cschwan

Ответы:

Вы можете просто использовать другие меры масштаба / дисперсии, такие как межквантовый диапазон, на которые не влияет асимптотика хвоста и, следовательно, квадратная интегрируемость. С дополнительным преимуществом, что зачастую они в целом более устойчивы.

Очевидно, что их следует применять к передискретизации / начальной загрузке с последующей оценкой среднего значения, а не непосредственно к исходному результату выборки MC функции перед усреднением. Вы также можете в общем проверить L-оценки и адаптировать один из них, чтобы объединить эти два шага в один для повышения производительности, но мысленно эти два распределения не следует путать, даже если PDF-файл оценки естественным образом наследует некоторые характеристики (включая, возможно, отсутствие квадрата). интегрируемость).

кварцевый
источник

+1, я должен добавить, что закон больших чисел не требует вторых моментов, так что это очень хороший совет.

mpiktas

Спасибо за Ваш ответ! Я должен признать, что впервые прочитал эти термины, но, посмотрев их на WP, я думаю, что ваш ответ указывает мне правильное направление. Не могли бы вы или кто-то другой предложить какие-нибудь статьи или книги, которые объясняют предметы более подробно?

Теперь я замечаю, что, возможно, мой ответ был немного неясным. Поскольку вы моделируете, вам на самом деле не требуется повторная выборка / начальная загрузка, теоретически вы можете просто добавить дополнительные новые выборки и получить эмпирическое распределение для средней оценки. Только если ресурсы вызывают беспокойство, вы можете предварительно рассчитать частичные средние значения и пересчитать их, но статистика не будет тривиальной, если она хорошо сделана. Я не эксперт по бустрапу, поэтому я оставлю совет по этому поводу другим, просто хотел бы указать на это, если вам нужно выйти за рамки простой формулировки. Сначала сконцентрируйтесь на мерах дисперсии, а потом оптимизируйте.

Кварц

Предложенная средняя оценка не имеет конечной дисперсии. Неважно, если добавить дополнительные образцы, эмпирическое распределение оценки также будет иметь конечную дисперсию. Вы можете подтвердить это с помощью нескольких симуляций.

rajb245

Конечно, на самом деле это то, что обсуждалось, и причина, по которой нужно использовать другую меру дисперсии.

Кварц