Интеграция Монте-Карло для не квадратично интегрируемых функций

9

Я надеюсь, что это правильное место, чтобы спросить, если не стесняйтесь перенести его на более подходящий форум.

Я довольно долго размышлял о том, как обрабатывать неквадратные интегрируемые функции с помощью интеграции Монте-Карло. Я знаю, что MC все еще дает правильную оценку, но ошибка нереальна (расходится?) Для такого рода функций.

Давайте ограничим нас одним измерением. Интеграция Монте-Карло означает, что мы приближаем интеграл

I=01dxf(x)

используя оценку

E=1Ni=1Nf(xi)

с равномерно распределенными случайными точками. Закон больших чисел гарантирует, что . Выборочная дисперсияxi[0,1]EI

S2=1N1i=1N(f(xi)E)2

аппроксимирует дисперсию распределения, индуцированного . Однако, если не является квадратично интегрируемым, т.е. интеграл от квадрата функции расходится, это подразумеваетσ2ff

σ2=01dx(f(x)I)2=01dxf2(x)I2

Это означает, что дисперсия также расходится.

Простой пример - функция

f(x)=1x

для которого и .I=01dx1x=2σ2=01dx(1x2)=[lnx2x]01

Если конечно, можно приблизить ошибку среднего помощью , но что если не является квадратично интегрируемым?σ2E f(x)SNσNf(x)

cschwan
источник
1
Я не понимаю: вы начинаете с того, что что ни один из имеет дисперсии, а затем спрашиваете, будет ли дисперсия их среднего значения разумной оценкой этой несуществующей дисперсии! Или я неправильно понял этот вопрос: возможно, под «статистически независимыми оценками» вы имеете в виду какую-то другую (возможно, надежную) оценку интеграла? Ei
whuber
Я не говорил, что не имеет дисперсии, только то, что я не могу определить для нее дисперсию с помощью . Таким образом, вопрос , могу ли я определить ошибку на всех , и если является разумным кандидатом. Под статистически независимым я подразумеваю, что получаются с использованием разных случайных чисел, например, с использованием генераторов случайных чисел с разным семенем (надеюсь, тогда это правильный термин). S 2 ˉ S 2 E iES2S¯2Ei
cschwan
Пожалуйста, объясните, что вы имеете в виду, не имея возможности «определить дисперсию для нее с помощью ». Я не могу понять это, используя стандартные определения дисперсии и . S 2S2S2
whuber
Ну, функция не является квадратично интегрируемой, поэтому, если я не ошибаюсь, должно расходиться . Если это так, то определение не имеет смысла, не так ли? Однако с помощью центральной предельной теоремы все равно будет сходиться к истинному значению интеграла, но без ошибки само по себе это значение не имеет смысла (насколько «хорош» этот результат?). S 2 ES2S2E
cschwan
Извините, я хотел сказать «закон больших чисел», конечно, не CLT.
cschwan

Ответы:

2

Вы можете просто использовать другие меры масштаба / дисперсии, такие как межквантовый диапазон, на которые не влияет асимптотика хвоста и, следовательно, квадратная интегрируемость. С дополнительным преимуществом, что зачастую они в целом более устойчивы.

Очевидно, что их следует применять к передискретизации / начальной загрузке с последующей оценкой среднего значения, а не непосредственно к исходному результату выборки MC функции перед усреднением. Вы также можете в общем проверить L-оценки и адаптировать один из них, чтобы объединить эти два шага в один для повышения производительности, но мысленно эти два распределения не следует путать, даже если PDF-файл оценки естественным образом наследует некоторые характеристики (включая, возможно, отсутствие квадрата). интегрируемость).

кварцевый
источник
+1, я должен добавить, что закон больших чисел не требует вторых моментов, так что это очень хороший совет.
mpiktas
Спасибо за Ваш ответ! Я должен признать, что впервые прочитал эти термины, но, посмотрев их на WP, я думаю, что ваш ответ указывает мне правильное направление. Не могли бы вы или кто-то другой предложить какие-нибудь статьи или книги, которые объясняют предметы более подробно?
13
Теперь я замечаю, что, возможно, мой ответ был немного неясным. Поскольку вы моделируете, вам на самом деле не требуется повторная выборка / начальная загрузка, теоретически вы можете просто добавить дополнительные новые выборки и получить эмпирическое распределение для средней оценки. Только если ресурсы вызывают беспокойство, вы можете предварительно рассчитать частичные средние значения и пересчитать их, но статистика не будет тривиальной, если она хорошо сделана. Я не эксперт по бустрапу, поэтому я оставлю совет по этому поводу другим, просто хотел бы указать на это, если вам нужно выйти за рамки простой формулировки. Сначала сконцентрируйтесь на мерах дисперсии, а потом оптимизируйте.
Кварц
Предложенная средняя оценка не имеет конечной дисперсии. Неважно, если добавить дополнительные образцы, эмпирическое распределение оценки также будет иметь конечную дисперсию. Вы можете подтвердить это с помощью нескольких симуляций.
rajb245
1
Конечно, на самом деле это то, что обсуждалось, и причина, по которой нужно использовать другую меру дисперсии.
Кварц