Этот вопрос вытекает из вопроса о «.632 Правиле». Я пишу с особым вниманием к ответу / примечанию пользователя 603 в той степени, в которой это упрощает вопросы.
Этот ответ начинается с выборки размера с заменой из различных элементов в коллекции (вызов) it N. Вероятность того, что выборка отличается от конкретного элемента из N, равнаn i t h s i m ( 1 - 1 / n ) .
В этом ответе все элементы N имеют одинаковую вероятность случайного выбора.
У меня такой вопрос: предположим, вместо этого, что в приведенном выше вопросе элементы, которые должны быть нарисованы, таковы, что они обычно распределены. То есть мы подразделяем стандартную нормальную кривую от до на (скажем) 100 субинтервалов равной длины. Каждый из 100 элементов в N имеет вероятность быть нарисованным, который равен области, представленной кривой в соответствующем интервале.Z = 4
Мое мышление было следующим:
Я думаю, что рассуждения аналогичны рассмотренному в связанном ответе. Вероятность того, что , с элементом N, равна в которой - это вероятность вытягиванияm P ( s i ≠ m ) = ( 1 - F i ) F i s i .
Вероятность того, что конкретный элемент m находится в образце S размера n, равна
= 1 - п П 1 ( 1 - F я ) .
Расчеты, кажется, показывают, что, поскольку длина подинтервалов становится небольшой, ответ сходится к тому же числу, что и в первом случае (вероятности все равны).
Это кажется нелогичным (для меня), потому что конструкция, кажется, добавляет элементы N, которые редки, поэтому я ожидаю, что число меньше, чем 0,632.
Кроме того, если это правильно, я думаю, мы бы
что я не знаю, чтобы быть правдой или ложью еще.
Изменить: Если это правда, это, вероятно, будет обобщать некоторые.
Спасибо за любые идеи.
источник
Ответы:
Вопрос касается ограничивающего поведения
по мере роста и равномерного сжатия таким образом, что (а) все неотрицательны и (б) они сводятся к единице. (Они следуют из построения и аксиом вероятности.)F i F in Fi Fi
По определению этот продукт является экспонентой его логарифма:
Теорема Тейлора (с формой Лагранжа от остатка) , примененная к , устанавливает, чтоlog
для некоторого в интервале . Другими словами, эти логарифмы равны точностью до слагаемых, которые не более чем в раза превышают . Но когда достаточно велико, чтобы гарантировать, что все меньше некоторого заданного (условие, гарантированное равномерной усадкой ), тогда (b) подразумевает и поэтомуϕi [0,Fi] −Fi 1/2 F2i n Fi ϵ>0 Fi nϵ>∑Fi=1
следовательно
сжимает логарифм между двумя последовательностями, сходящимися к . Поскольку непрерывен, произведение сходится к экспоненте этого предела, . следовательно−1 exp ∏ni=1(1−Fi) exp(−1)
КЕД .
При более внимательном рассмотрении этого анализа устанавливается, что ошибка в этом приближении (которая всегда будет нижней границей) не больше по размеру, чем Например, разделение стандартного нормального распределения на срезов между и дает максимальное около режима , где оно приблизительно будет равно площади прямоугольника, . Приведенная выше граница устанавливает, что значение формулы будет в пределах от ее предельного значения. Фактическая ошибка на порядок меньше,п=400-44 Р я 0ехр(-1 / 2) / 50≈0,012(1)0,0110,001041 е я 1
R
(которому мы можем доверять, потому что ни один из является действительно маленьким относительно ):В самом деле,0.6331615… 1−exp(−1) 0.6321206…
1 - prod(1-f)
это , тогда как является .1 - exp ( - 1 ) 0,6321206 …источник