Эта область называется микротаргетинг (если вы хотите, чтобы Google для этого). Кампании довольно скрытны в отношении своих инструментов и процедур, поэтому, насколько мне известно, опубликовано не так много работ, за исключением « Политического таргетинга» Хэла Малхоу (2008 г.) или «Грин и Гербер» (2008 г.). «Голосуй: как увеличить явку избирателей» (последняя сделка больше с социальными аспектами, такими как реклама и тому подобное).
Что касается более технических вопросов, то литература еще скуднее, но см., Например, Murray & Scime (2010) , документ «Политический анализ» Imai & Strauss (2011) ( постпринт ) или недавний документ «Анналы прикладной статистики», опубликованный нами Rusch, Lee, Hornik, Jank & Zeileis (2013) ( постпринт ). Общим для всех является то, что они используют методы интеллектуального анализа данных, в основном на основе дерева.
Murray & Scime используют стандартные деревья классификации, такие как CART.
Rusch et al. использовать деревья классификации, логистические модели и гибрид деревьев и логистическую регрессию. Они также используют (среди прочего) случайные леса, нейронные сети, машины опорных векторов и деревья байесовской аддитивной регрессии для сравнения со своими гибридами деревьев, как описано в ответе к статье . Их гибридные деревья работают наравне с другими методами в своих наборах данных и обеспечивают повышенную интерпретируемость (мы также предоставляем их код и данные).
Imai & Strauss интересны тем, что представляют всеобъемлющую теоретическую основу для оптимального планирования кампании, а не просто инструменты для микротаргетинга, как это делают другие. Таким образом, они очень сосредоточены на аспектах операционных исследований о том, как извлечь максимальную выгоду из каждого доллара, вложенного в кампанию. В аспекте их структуры, где они используют статистические методы для микротаргетинга и оценки явки, они снова полагаются на деревья классификации.
Таким образом, кажется, есть некоторый консенсус, что использование методов на основе дерева хорошо работает в этой области.