Опросы, проводимые там (скажем, Gallup), показывают неимоверно низкое количество людей по сравнению с численностью населения (например, возможно, тысяча человек из сотен миллионов).
Теперь для меня выборка населения как средство оценки статистики населения имеет смысл, когда у вас есть веские основания полагать, что выборки являются репрезентативными для населения (или, аналогично, других выборок ) .
Например, выборка, очевидно, имеет смысл для медицинских исследований, потому что мы априори знаем, что у всех людей есть довольно похожие геномы и что этот фактор заставляет их тела вести себя одинаково.
Обратите внимание, что это не какая-то слабая связь - геном является чертовски сильным определяющим фактором .
Однако я просто не понимаю, что оправдывает использование небольших выборок для таких вещей, как политические опросы.
Я мог бы купить, что, возможно, 80-90% людей в любом данном районе голосуют за президента одинаково (из-за схожих социально-экономических / образовательных условий), но это вряд ли оправдывает абсурдно низкое количество выборок. В буквальном смысле нет веской причины (по крайней мере для меня), почему 1000 случайных избирателей должны вести себя как 200 миллионов других избирателей.
Для меня вам нужно, по крайней мере, как (скажем) в 100 раз больше. Почему? Я могу придумать несколько причин, например:
Всего в Калифорнии около 22 000 участков . Люди растут настолько по-разному в своем экономическом и образовательном плане, что опрос размером 1000 кажется смехотворно маленьким. Как вы можете суммировать целые участки с <1 человеком в среднем?
Люди обычно не могут изменить реакцию своего тела на медицину, но они могут изменить свое мнение о политике, просто подумав об этом. На мой взгляд, в медицине нет никакого фактора воздействия, похожего на ДНК, когда вы занимаетесь политикой. В лучшем случае я предполагаю, что должны быть небольшие карманы корреляции.
Тем не менее, как-то опросы вроде этого ... все равно работают? Или, по крайней мере, люди, кажется, думают, что они делают?
Но почему они должны? Может быть, я просто принципиально не понимаю выборки ? Может кто-нибудь объяснить?
Я просто не могу воспринимать всерьез какие-либо опросы, которые я вижу, но я чувствую себя более или менее одиноким в этом ...
источник
Ответы:
Кажется, вы представляете себе очень простую модель выборки.
Самая простая модель для выборки называется удачно простой случайной выборкой . Вы выбираете часть населения (например, путем случайного набора телефонных номеров) и спрашиваете, кто ответит, как они голосуют. Если 487 скажут Клинтон, 463 скажут Трамп, а остальные дадут вам какой-то дурацкий ответ, тогда избирательная фирма сообщит, что 49% избирателей предпочитают Клинтона, а 46% предпочитают Трампа. Тем не менее, избирательные фирмы делают гораздо больше, чем это. Простая случайная выборка дает равный вес каждой точке данных. Однако предположим, что в вашей выборке случайно - 600 мужчин и 400 женщин, что явно не является представителем населения в целом. Если мужчины в группе склоняются в одну сторону, а женщины - в другой, это повлияет на ваш результат. Однако, поскольку у нас довольно хорошая демографическая статистика, вы можете взвесить *ответы, подсчитывая ответы женщин немного больше, а мужчин немного меньше, так что взвешенный ответ лучше отражает население. У опросных организаций есть более сложные модели взвешивания, которые могут сделать нерепрезентативную выборку более похожей на репрезентативную.
Идея взвешивания выборочных ответов лежит на достаточно твердой статистической основе, но есть некоторая гибкость в выборе факторов, влияющих на весовые коэффициенты. Большинство социологов проводят переоценку веса на основе демографических факторов, таких как пол, возраст и раса. Учитывая это, вы можете подумать, что идентификация партии (демократическая, республиканская и т. Д.) Также должна быть включена, но оказывается, что большинство избирательных фирм не используют ее в своих весах: идентификация партии (само) идентифицируется с выбором избирателя. таким образом, что делает его менее полезным.
Многие организации для голосования также сообщают о своих результатах среди «вероятных избирателей». В них респонденты либо отбираются, либо взвешиваются на основе вероятности того, что они действительно окажутся на выборах. Эта модель, несомненно, также основана на данных, но точный выбор факторов обеспечивает некоторую гибкость. Например, включение взаимодействия между кандидатом и расой (или полом) избирателя было даже разумным до 2008 или 2016 года, но я подозреваю, что у них сейчас есть некоторая предсказательная сила.
Теоретически, вы можете включить в качестве весовых факторов все виды вещей: музыкальные предпочтения, цвет глаз и т. Д. Однако демографические факторы являются популярным выбором для весовых факторов, потому что:
Однако опросчики также видят те же новости, что и все остальные, и могут при необходимости корректировать весовые переменные.
Есть также некоторые «факторы выдумки», которые иногда используются для объяснения результатов опроса. Например, респонденты иногда неохотно дают «социально нежелательные» ответы. Эффект Брэдли утверждает, что белые избиратели иногда преуменьшают свою поддержку белых кандидатов, баллотирующихся против меньшинства, чтобы избежать появления расистов. Он назван в честь Тома Брэдли, афроамериканского кандидата в губернаторы, который едва не проиграл выборы, несмотря на то, что комфортно лидировал в опросах.
Наконец, вы абсолютно правы в том, что сам факт запроса чьего-либо мнения может изменить его. Избирательные фирмы пытаются написать свои вопросы нейтральным образом. Чтобы избежать проблем с порядком возможных ответов, имена кандидатов могут быть перечислены в случайном порядке. Несколько версий вопроса также иногда проверяются друг против друга. Этот эффект также может быть использован для гнусных целей в пуш-опросе , где интервьюер на самом деле не заинтересован в сборе ответов, а во влиянии на них. Например, опрос может спросить: «Вы бы проголосовали за [кандидата А], даже если сообщалось, что он был растлителем детей?»).
* Вы также можете установить точные цели для вашего образца, например, 500 мужчин и 500 женщин. Это называется стратифицированной выборкой - популяция стратифицируется на разные группы, и каждая группа затем выбирается случайным образом. На практике это не так часто для опросов, потому что вам нужно разделить на множество исчерпывающих групп (например, мужчины с 18-24 года в Городском Техасе с высшим образованием).
источник
Есть математическая теорема, которая называется «закон больших чисел». Представьте, что вы хотите определить вероятность появления монеты в голове. «Население» подбрасываний монет бесконечно - намного больше, чем 300 000 000 человек в Соединенных Штатах. Но согласно закону больших чисел, чем больше монет вы подбрасываете, тем точнее будет ваша оценка.
Идеальный опрос: В идеальном опросе, избиратели будут случайным образом выбирать имена из переписи населения США, узнавать, где живут эти люди, а затем идти и стучать в их двери. Если человек говорит, что планирует голосовать, опросчик спрашивает, за кого он голосует, и записывает свой ответ. Опрос, подобный этому, математически гарантированно работает, и количество ошибок в ваших измерениях для любого заданного уровня достоверности может быть легко вычислено .
Вот что означает ошибка: Предположим, что, исходя из вашего опроса, вы получили 52-процентную вероятность того, что Кандидат Awesome McPerfect победит, с 3% -ной ошибкой с 98% -ной достоверностью. Это означает, что вы можете быть на 98% уверены, что истинная доля избирателей, поддерживающих кандидата Awesome McPerfect, составляет от 49% до 55%.
Замечание об ошибке и достоверности Для данного размера выборки, чем увереннее вы будете, тем больше будет ваша ошибка. Подумайте об этом - вы на 100% уверены, что истинная доля, поддерживающая кандидатуру Awesome, составляет от 0% до 100% (максимально возможная ошибка), и вы на 0% уверены, что истинная доля, поддерживающая кандидатуру Awesome, составляет точно 52,0932840985028390984308% (ноль ошибок). Большее доверие означает больше ошибок, меньшее доверие означает меньше ошибок. Однако связь между доверием и ошибкой НЕ является линейной! (См .: https://en.wikipedia.org/wiki/Confidence_interval )
Опросы в реальном мире: потому что вертолетные опросы во все части страны обходятся дорого, чтобы постучать в двери случайных людей (хотя я бы хотел, чтобы это произошло; если вы миллиардер и вы это видите, пожалуйста, рассмотрите возможность финансирования), опросы в реальном мире более сложны. Давайте посмотрим на одну из наиболее распространенных стратегий - вызвать случайных избирателей и спросить их, за кого они будут голосовать. Это хорошая стратегия, но в ней есть некоторые общеизвестные недостатки:
Поскольку разные демографические группы голосуют по-разному, избиратели должны сделать все возможное, чтобы контролировать различия в своих исходных данных (в зависимости от того, кто решил ответить на телефонные звонки) и результаты реальных выборов. Например, если 10% людей, которые подняли трубку, были латиноамериканцами, но 30% избирателей на последних выборах были латиноамериканцами, то они собираются в три раза увеличить вес латиноамериканских избирателей в своем опросе. Если 50% людей, ответивших на звонок, были старше 60 лет, но только 30% проголосовавших на последних выборах были старше 60 лет, они будут придавать меньший вес старшим избирателям, которые ответили. Это не идеально, но это может привести к некоторым впечатляющим предсказаниям (Нейт Сильвер правильно предсказал результаты в каждом из 50 штатов на выборах 2012 года, используя статистику,
Мудрое предостережение: опрашивающие делают лучшие прогнозы, какие только могут, исходя из того, как все сложилось в прошлом. Вообще говоря , сейчас все происходит примерно так же, как и в прошлом, или, по крайней мере, изменения происходят достаточно медленно, чтобы недавнее прошлое (на котором они больше всего фокусировались) напоминало настоящее. Однако иногда происходят быстрые изменения в электорате, и все идет не так. Возможно, избиратели Трампа немного реже, чем ваш средний избиратель, ответят на звонок, и взвешивание по демографии не учитывает этого. Или может быть молодые люди (которые в подавляющем большинстве поддерживают Хиллари) еще большевряд ли ответит на звонок, как предсказывают модели, а ответившие на звонок, скорее всего, будут республиканцами. Или, может быть, верно противоположное тому и другому - мы не знаем. такие вещи являются скрытыми переменными, которые не отображаются в общедоступных демографических данных.
Мы бы знали, послали ли мы опросчиков, чтобы постучать в случайные двери (хм, мнимые миллиардеры читают это), с тех пор нам не пришлось бы взвешивать вещи, основываясь на демографии, но до тех пор пальцы скрещивались.
источник
Во-первых, это помимо ваших основных моментов, но стоит упомянуть. В медицинском исследовании у вас может быть 1000 человек, которые тестируют препарат, который можно давать 10000 людям, которые болеют ежегодно. Вы можете посмотреть на это и подумать: «Это тестируется на 10% населения», на самом деле это не 10000 человек, это все будущие пациенты, поэтому численность населения бесконечна. 1000 человек невелики по сравнению с бесконечными потенциальными потребителями наркотиков, но исследования такого рода работают. Не важно, тестируете ли вы 10%, 1% или 0,1% населения; важен абсолютный размер выборки, а не ее размер по сравнению с населением.
Далее, ваша главная мысль заключается в том, что существует так много смешанных переменных, которые могут повлиять на голосование людей. Вы рассматриваете 22000 районов Калифорнии как 22000 переменных, но на самом деле это всего лишь несколько переменных (доход и образование, как вы упомянули). Вам не нужна репрезентативная выборка из каждого района, вам просто нужно достаточно выборки, чтобы покрыть разницу в зависимости от дохода, образования и т. Д.
Редактировать:
Приведенная выше формула предполагала, что каждая смешанная переменная одинаково важна. Если мы хотим рассмотреть сотни вещей, которые могут добавить дисперсию к результатам, то это предположение неверно (например, может быть, пользователи твиттера поддерживают одного кандидата больше, но мы знаем, что использование твиттера не так важно, как пол).
источник