Предпосылки и терминология
Чтобы было совершенно ясно, что мы обсуждаем, давайте установим некоторые понятия и терминологию. Хорошей моделью для пропорций является двоичная урна: она содержит шары, окрашенные либо в серебро («успех»), либо в фуксию («провал»). Доля серебряных шариков в урне равна (но это не та пропорция, о которой мы будем говорить). p
Эта урна позволяет моделировать процесс Бернулли . Чтобы получить одно представление , тщательно перемешайте шарики и вслепую вытяните один, следя за его цветом. Чтобы получить дополнительные реализации, сначала восстановите коробку, вернув нарисованный мяч, затем повторите процедуру заранее определенное количество раз. Последовательность реализаций могут быть сведены на число его успехи, . Это случайная величина, свойства которой полностью определяются и . Распределение называется биномиальным распределением. (Экспериментальная, или «выборочная») пропорция - это отношениеX n p X ( n , p ) X / nnXnpX(n,p)X/n,
Эти цифры являются диаграммами распределения вероятностей для различных биномиальных пропорций . Наиболее примечательным является непротиворечивый паттерн, независимо от , в котором распределения становятся более узкими (и столбцы соответственно выше), когда перемещается от вниз.п р 1 / 2X/nnp1/2
Стандартное отклонение является стандартной ошибкой пропорции, упомянутой в вопросе. Для любого данного эта величина может зависеть только от . Давайте назовем это . Переключая роли шаров - назовите серебряные «неудачниками», а фуксии - «успехами» - легко увидеть, что . Таким образом, ситуация, когда то есть, должна быть особенной. Вопрос касается того, как изменяется при перемещении от сторону более экстремального значения, такого какn p se ( p ) se ( p ) = se ( 1 - p ) p = 1 - pX/nnpse(p)se(p)=se(1−p)p=1−pс ( р )p=1/2se(p)1 / 2 0p1/20,
Знание против понимания
Поскольку всем показывали подобные цифры в начале своего образования, все «знают» ширину графиков, которые измеряются с помощью должны уменьшаться по мере удаления от . Но это знание на самом деле просто опыт, тогда как вопрос требует более глубокого понимания. Такое понимание доступно из тщательного анализа биномиальных распределений, таких как «Авраам де Моивр», предпринятый около 300 лет назад. (Они были близки по духу тем, которые я представил в обсуждении центральной предельной теоремы .) Однако я думаю, что некоторые относительно простые соображения могут быть достаточными, чтобы подчеркнуть, что ширины должны быть самыми широкими вблизи .р 1 / 2 р = 1 / 2se(p)p1/2p=1/2
Простой интуитивный анализ
Ясно, что следует ожидать, что доля успехов в эксперименте будет близка к . Стандартная ошибка касается того, как далеко от этого ожидания мы можем разумно предположить, что фактический результат будет лежать. Предположим, без потери общности, что находится между и , что потребуется для увеличения от ? Как правило, около шаров, нарисованных в эксперименте, были серебряными и (следовательно) около были фуксиями. Чтобы получить больше серебряных шаров, некоторые из этихpX/np01/2X/nppn(1−p)npnрезультаты фуксии должны были отличаться. Насколько вероятно, что этот шанс мог бы действовать таким образом? Очевидный ответ заключается в том, что когда мало, мы вряд ли собираемся нарисовать серебряный шар. Таким образом, наши шансы нарисовать серебряные шары вместо фуксии всегда низкие. Мы можем разумно надеяться, что по чистой случайности доля результатов фуксии могла бы отличаться, но кажется маловероятным, что многое другое изменилось бы. Таким образом, вполне вероятно, что не будет меняться намного больше, чем . Эквивалентно, не будет меняться намного больше, чем .ppXp×(1−p)nX/np(1−p)n/n=p(1−p)
развязка
Таким образом появляется волшебная комбинация . p(1−p) Это фактически решает вопрос: очевидно, что эта величина достигает максимума при и уменьшается до нуля при или . Это дает интуитивное, но в то же время количественное обоснование утверждений о том, что «одна крайность более ограничивающая, чем другая», или других подобных попыток описать то, что мы знаем.p=1/2p=0p=1
Тем не менее, не совсем правильное значение: оно лишь указывает путь, говоря нам , какое количество должно иметь значение для оценки распространения . Мы игнорировали тот факт, что удача также имеет тенденцию действовать против нас: так же, как некоторые из шаров фуксии могли быть серебряными, некоторые из серебряных шаров могли быть фуксиями. Учет всех возможностей строго может усложниться, но в результате вместо того, чтобы использовать в качестве разумного предела того, насколько может отклоняться от его ожидания , для правильного учета всех возможных результатов мы имеем взять квадратный кореньp(1−p)Xp(1−p)nXpn p(1−p)n−−−−−−−−√, (Для более подробного объяснения причин, пожалуйста, посетите ( https://stats.stackexchange.com/a/3904 .) Делая на , мы узнаем, что случайные изменения самой пропорции должны быть порядка что является стандартной ошибкой .nX/nх/нp(1−p)n−−−−−−−−√/n=p(1−p)n−−−−−√,X/n
Биномиальное распределение имеет тенденцию быть примерно симметричны (при большом это примерно нормально ).n
Поскольку отношение должно быть между 0 и 1, неопределенность будет ограничена этими границами. Если среднее отношение не находится точно посередине, одна из этих границ будет более ограничивающей, чем другая.
Чтобы симметричная унимодальная кривая колокола с центром в точке соответствовала единичному интервалу, ее полуширина должна быть меньше .p min[p,1−p]
источник