Методы добычи данных в кампании Обамы

10

Я наткнулся на эту статью о команде интеллектуального анализа данных в предвыборной кампании Обамы. К сожалению, статья очень размыта о фактическом механизме статистических алгоритмов. Однако это звучало так, как будто общие методы известны в социальных и политических науках. Поскольку это не моя область знаний, может ли кто-нибудь указать мне (обзор) литературу об этих видах техники?

fabee
источник

Ответы:

16

Эта область называется микротаргетинг (если вы хотите, чтобы Google для этого). Кампании довольно скрытны в отношении своих инструментов и процедур, поэтому, насколько мне известно, опубликовано не так много работ, за исключением « Политического таргетинга» Хэла Малхоу (2008 г.) или «Грин и Гербер» (2008 г.). «Голосуй: как увеличить явку избирателей» (последняя сделка больше с социальными аспектами, такими как реклама и тому подобное).

Что касается более технических вопросов, то литература еще скуднее, но см., Например, Murray & Scime (2010) , документ «Политический анализ» Imai & Strauss (2011) ( постпринт ) или недавний документ «Анналы прикладной статистики», опубликованный нами Rusch, Lee, Hornik, Jank & Zeileis (2013) ( постпринт ). Общим для всех является то, что они используют методы интеллектуального анализа данных, в основном на основе дерева.

Murray & Scime используют стандартные деревья классификации, такие как CART.

Rusch et al. использовать деревья классификации, логистические модели и гибрид деревьев и логистическую регрессию. Они также используют (среди прочего) случайные леса, нейронные сети, машины опорных векторов и деревья байесовской аддитивной регрессии для сравнения со своими гибридами деревьев, как описано в ответе к статье . Их гибридные деревья работают наравне с другими методами в своих наборах данных и обеспечивают повышенную интерпретируемость (мы также предоставляем их код и данные).

Imai & Strauss интересны тем, что представляют всеобъемлющую теоретическую основу для оптимального планирования кампании, а не просто инструменты для микротаргетинга, как это делают другие. Таким образом, они очень сосредоточены на аспектах операционных исследований о том, как извлечь максимальную выгоду из каждого доллара, вложенного в кампанию. В аспекте их структуры, где они используют статистические методы для микротаргетинга и оценки явки, они снова полагаются на деревья классификации.

Таким образом, кажется, есть некоторый консенсус, что использование методов на основе дерева хорошо работает в этой области.

Момо
источник