В этом посте мы задаем вопрос о природном явлении под названием « попытка человека найти решение путем подсчета голосов» . Конкретный случай такого естественного явления, о котором идет речь в этом вопросе, относится к делу Brexit .
Примечание: вопрос не в политике. Цель состоит в том, чтобы попытаться обсудить такое естественное явление со статистической точки зрения, основанной на наблюдениях.
Конкретный вопрос:
- Вопрос: Что означает голосование Brexit чтобы уйти ? Например, означает ли это, что общественность действительно хочет покинуть ЕС? Означает ли это просто, что публика не уверена и ей нужно больше времени для размышлений? Или что-то еще?
Предположение 1: в процессе голосования нет ошибок.
statistical-significance
voting-system
троглодит
источник
источник
Ответы:
Я согласен с @Underminer, что нет ошибки выборки, но не потому, что выборка велика, а потому, что выборка не была задействована . Никто не был выбран для голосования. Очевидно, была какая-то незначительная доля людей, которые хотели проголосовать, но не смогли (например, попали в автомобильную аварию в этот день) или сделали недействительные голоса, но это единственная «выборка» здесь.
Результат точный, ошибки нет, так как все население приняло участие в голосовании (некоторые приняли участие, не приняв в нем участия). Некоторые люди решили голосовать, некоторые нет. Некоторые решили проголосовать в отпуске, некоторые нет. Демократия не в статистической значимости, а в том, что действительно произошло . Голосование предназначено не для того, чтобы узнать мнение людей, а для принятия решения. На самом деле, люди иногда голосуют не в соответствии с тем, что они думают, но чтобы проявить или достичь чего-то . Например, на выборах люди могут голосовать не за своего предпочтительного кандидата, а за второго предпочтительного, если считают, что у него больше шансов на победу.
источник
51,9% - это процент избирателей, которые хотят уйти . Поскольку размер выборки настолько велик (> 33 миллиона), случайной ошибки выборки практически нет.
Статистическая проверка значимости будет пытаться определить , есть ли разница в остаться и отпуск может быть объяснен случайной ошибкой выборки в одиночку, и разница, несомненно , будет значительной (см @ ответа пещерного).
Проблема с этим подходом состоит в том, что статистическая значимость делает очень сильное предположение, что выборка является репрезентативной для всего населения (всей Британии), а не только для тех, кто голосует.
Уровень отсутствия ответов (те, кто не голосует) чрезвычайно важен для определения, хочет ли более половины всей Британии «уйти», и его трудно измерить. Смещение отсутствия ответа создается, когда подгруппы, которые с меньшей вероятностью проголосуют, имеют систематически разные взгляды. Например, исходя из опросов, проведенных на выходе, миллениалы реже голосовали, но с большей вероятностью проголосовали за то, чтобы остаться , что искажает результаты при попытке представить население всей Британии.
По этой причине статистическая значимость тестирования в его традиционном смысле в значительной степени неуместна .
Предположения: нам нужно определить некоторые термины для того, чтобы все это имело смысл и чтобы избежать политического обсуждения того, что пытается достичь голосование. Вот мои определения:
Население: каждый человек, живущий в Британии
Структура выборки: каждый человек, имеющий право голоса, может голосовать
Методология выборки: добровольный ответ, акт голосования участвует в опросе
Образец: лица, которые действительно голосуют
В этой схеме пропорция выборки может использоваться (к лучшему или к худшему), чтобы оценить процент всех людей, которые склоняются к тому, чтобы остаться (или уйти ).
источник
Ты спрашиваешь
Это означает, что 51,9% избирателей проголосовали за уход.
Голоса составляли "оставленных" голосов и "оставшихся" голосов, что означает, что подходящих избирателей не проголосовали и приблизительно миллионов жителей не имеют права голоса. Поскольку ни фактическое собрание избирателей, ни собрание подходящих избирателей не являются «публичными» и не являются репрезентативной (случайной, беспристрастной, выберите подходящее прилагательное) выборкой «публики», 51,9% голосов Brexit не информируют вашего второго и последующие вопросы.17421+887 16146297 12+931353 18
Возможно, можно было создать анкету, отвечающую вашим вопросам. Похоже, что это не было тем, что произошло на референдуме, как осуществлено.
источник
TL; DR
Я смоделировал неуверенную популяцию ниже (под деталями ) для раз, а затем измерил вероятность наблюдения за отпуском в размере при такой неуверенной имитированной популяции. Это дало мне смоделированную вероятность того, что неуверенное население сможет достичь разрешения на голосование, которое составляет или более.R=1000 ≥51.9% 51.9%
Эта моделируемая вероятность отпуска под неуверенным населением равна .0
Может быть излишними, но я также сделал то же самое , но с остается измерить вероятность того, что такое неуверенное население , чтобы получить голоса остаются .≤48.1%
Эта моделируемая вероятность остаться под неуверенным населением также равна .0
Поэтому я прихожу к выводу, что голосование Brexit не является шумным побочным эффектом неуверенного или растерянного населения. Кажется, есть систематическая причина, побуждающая их покинуть ЕС.
Я загрузил код симулятора здесь: https://github.com/Al-Caveman/Brexit
Детали
Учитывая предположение 1 , возможные ответы (или гипотезы):
Примечание: что это невозможно , что публика уверенно хочет остаться , потому что мы исключили ошибки голосования.
Чтобы ответить на этот вопрос (т. или ), я постараюсь измерить:H0 H1
Если эта вероятность достаточно мала, мы можем сделать вывод, что публика уверенно хочет уйти (то есть ). Однако, если эта вероятность достаточно велика, мы можем сделать вывод, что публика не уверена в том, что решит вопрос о Brexit (то есть ).H1 H0
Чтобы измерить эту вероятность, нам нужно знать распределение неуверенного британского населения в такой бинарной системе голосования, как Brexit. Поэтому мой первый шаг к этому - смоделировать это распределение, следуя предположению ниже:
На мой взгляд, это предположение справедливо / разумно.
Кроме того, мы моделируем кампании отпуска и оставления как два отдельных процесса следующим образом:
где:
с учетом следующего ограничения:
Например, если , это означает , что из населения , один проголосовал да , чтобы оставить и два не проголосовали не для покинуть .Oleave=[1,0,0] 3
Аналогично, если , это означает , что из населения , один проголосовал да , чтобы остаться и два не голосовали не по - прежнему .Oremain=[0,1,0] 3
Обратите внимание, что в обоих приведенных выше примерах есть один член населения, который не голосовал ни за один из процессов (или кампаний). В частности, третий избиратель (то есть ).Oleave[3]=Oremain[3]=0
Отсюда мы знаем , что из бюллетеней для голосования проголосовали за выход из ЕС (т.е. проголосовали за то, чтобы остаться ). Это означает:33,568,184 51.9% 100−51.9=48.1%
Поэтому мы определяем выходные массивы следующим образом:
Наконец, мы определяем значение отпуска процесса следующим образом : где - общее количество раундов моделирования, по которым в каждый момент времени случайный экземпляр определено.pleave
Аналогично, мы определяем значение для оставшегося процесса следующим образом:premain
Чтобы ответить на это, я смоделировал вышеизложенное в C, используя и получился результат:R=1,000
Другими словами:
источник
Вы могли бы задать немного другой вопрос: если предположить, что 50% очень большой популяции проголосовали "Да", а вы задали случайную выборку размера S, какова вероятность того, что 51,9% вашей выборки ответили "Да", в зависимости от размер образца?
Ожидаемое значение числа голосов «за» составляет 0,5 S. Разница составляет 0,25 S. Стандартное определение - 0,5 . Отклонение фактического от ожидаемого числа голосов «Да» более чем на 6,1 стандартного отклонения имеет шанс одного на миллиард.S1/2
Мы имеем это, когда 0,019 S (разница между 50% и 51,9%) составляет 6,1 * 0,5 * , или S = или S ≈ 25 800.S1/2 (6.1∗0.5/0.019)2
источник
Это еще одно решение с использованием аналитического метода вместо моделирования.
Ранее я симулировал неуверенное население, которое будет голосовать за случайные шансы. Таким образом, из большого количества избирателей, неуверенное население склонно голосовать за отпуск или оставаться в течение времени.n 0.5
Для того чтобы неуверенное население получило в отпуск ровно голосов , в должно быть единиц . Вероятность этого составляет . Точно так же вероятность получения голос также равна . Это продолжается.51.9% 17,421,887 Oleave 0.533,568,184 17,421,887+1 0.533,568,184
Это вероятность получения голосов:≥17,421,887
( рассчитано Вольфрамальфой )8.39663381928984×10−10105024
И это вероятность наличия от с неуверенным населением голосования отпуска .≥51.9%
источник