У меня есть некоторые интересные данные о самых популярных музыкальных артистах, разделенных по местоположению на 200 избирательных округов. Я хочу посмотреть, возможно ли опросить человека по его или ее музыкальным предпочтениям и определить, «слушает ли он как демократ» или «слушает ли как республиканец». (Естественно, это легкомысленный, но в данных есть реальная энтропия!)
У меня есть данные о 100 художниках плюс средний процент голосов за республиканцев и демократов в каждом округе за последние три избирательных цикла. Таким образом, я установил соотношение для каждого художника, чтобы увидеть, каких из них слушали наиболее непропорционально, как функцию доли голосов для демократов. Эти корреляции варьируются от -0,3 до 0,3 для каждого художника, с большим количеством посередине, которые имеют небольшую или нулевую предсказательную силу.
У меня есть два вопроса: во-первых, общее количество потоков в районе сильно варьируется. Прямо сейчас я сопоставляю процент всех потоков в округе, принадлежащих, скажем, Бейонсе, с процентом голосов, отданных за демократов. Но общее количество потоков в одном районе может исчисляться миллионами, а в другом - 100 000 человек. Нужно ли как-то взвесить корреляцию, чтобы учесть это?
Во-вторых, мне любопытно, как объединить эти корреляции в сложное предположение относительно политики пользователя. Допустим, я беру 20 художников с самыми высокими абсолютными корреляционными значениями (положительными и отрицательными), по десять в каждом направлении, и опрашиваю пользователя о том, насколько он или она любит каждого художника. Таким образом, у меня есть голоса «за» или «против» каждого художника плюс соотношение к политике для всех 20 ценностей. Есть ли стандартный способ объединить эти корреляции в одну оценку? (Я думаю, что-то вроде знаменитой викторины NYTimes на диалекте , где она объединила региональные вероятности для 25 вопросов в тепловую карту. Но в этом случае мне просто нужно одно значение того, насколько демократичен или республиканец вкус в музыке.
Спасибо!
источник