Асимптотические результаты не могут быть подтверждены компьютерным моделированием, потому что они являются утверждениями, включающими понятие бесконечности. Но мы должны иметь возможность почувствовать, что вещи действительно идут так, как нам подсказывает теория.
Рассмотрим теоретический результат
где является функцией от случайных величин, скажем, одинаково и независимо распределенных. Это говорит о том, что сходится по вероятности к нулю. Примером архетипа здесь, я думаю, является случай, когда - среднее значение выборки минус общее ожидаемое значение iidrv's выборки,
ВОПРОС: Как мы можем убедительно показать кому-то, что указанное выше соотношение «материализуется в реальном мире», используя результаты компьютерного моделирования из обязательно конечных выборок?
Обратите внимание, что я специально выбрал сходимость к константе .
Ниже я приведу свой подход в качестве ответа, и я надеюсь на лучшие.
ОБНОВЛЕНИЕ: Что-то в моей голове беспокоило меня - и я узнал что. Я выкопал старый вопрос, где в комментариях к одному из ответов шла самая интересная дискуссия . Там @Cardinal предоставил пример оценки, что она непротиворечива, но ее дисперсия остается ненулевой и конечной асимптотически. Таким образом, более жесткий вариант моего вопроса становится следующим: как с помощью моделирования мы показываем, что статистика сходится по вероятности к константе, когда эта статистика асимптотически поддерживает ненулевую и конечную дисперсию?
источник
Ответы:
Я думаю о как функция распределения (дополнительная в конкретном случае). Поскольку я хочу использовать компьютерное моделирование, чтобы продемонстрировать, что все происходит так, как нам подсказывает теоретический результат, мне нужно построить эмпирическую функцию распределенияили эмпирическое распределение относительной частоты, а затем каким-то образом показать, что при увеличении значения сосредоточиться "больше и больше" до нуля. | X n | п | X n |п( ) |ИксN| N |ИксN|
Чтобы получить эмпирическую функцию относительной частоты, мне нужно (намного) больше, чем одна выборка, увеличивающаяся в размере, потому что с увеличением размера выборки распределениеизменения для каждого разные . N| ИксN| N
Поэтому мне нужно генерировать из распределения 's выборок «параллельно», скажем, в тысячах, каждый из которых имеет некоторый начальный размер , скажем, в десятках тысяч. Мне нужно тогда вычислить значениеиз каждого образца (и для того же ), т.е. получить набор значений . m m n n | X n | n { | х 1 н | , | х 2 н | , . , , , | х м н | }Yя м м N N | ИксN| N { | Икс1 н| , | Икс2 н| ,. , , , | Иксм н| }
Эти значения могут быть использованы для построения эмпирического распределения относительной частоты. Веря в теоретический результат, я ожидаю, что «много» значенийбудет "очень близко" к нулю, но, конечно, не все.| ИксN|
Итак, чтобы показать, что значениядействительно продвигайтесь к нулю в больших и больших числах, мне пришлось бы повторить процесс, увеличив размер выборки, скажем, до , и показать, что теперь концентрация до нуля «увеличилась». Очевидно, чтобы показать, что он увеличился, нужно указать эмпирическое значение для .2 n ϵ| ИксN| 2 н ε
Будет ли этого достаточно? Можем ли мы как-то формализовать это «увеличение концентрации»? Может ли эта процедура, если она выполняется в несколько этапов «увеличения размера выборки», причем один из них ближе к другому, дать нам некоторую оценку фактической скорости сходимости , то есть что-то вроде «эмпирической вероятностной массы, которая движется ниже порогового значения за каждый шаг "скажем, тысячи?N
Или изучите значение порога, для которого, скажем, % вероятности лежит ниже, и посмотрите, как это значение уменьшается по величине?ϵ90 ε
ПРИМЕР
Рассмотрим как и так U ( 0 , 1 )Yя U( 0 , 1 )
Сначала мы генерируем выборок размером каждая. Эмпирическое распределение относительной частотыпохоже п = 10 , 000 | X 10 , 000 |м = 1 , 000 п = 10 , 000 | Икс10 , 000|
и отметим, что % значенийменьше . | X 10 , 000 | 0.004615590,10 | Икс10 , 000| 0.0046155
Затем я увеличиваю размер выборки до . Теперь эмпирическое распределение относительной частотывыглядит, и мы отмечаем, что % значенийниже . В качестве альтернативы, теперь % значений падают ниже .| X 20 , 000 | 91,80 | X 20 , 000 | 0,0037101 98,00 0,0045217п = 20 , 000 | Икс20 , 000| 91,80 | Икс20 , 000| 0.0037101 98,00 0.0045217
Вас убедит такая демонстрация?
источник