Визуализация последовательных пропорций

9

Я пытаюсь визуализировать некоторые потребительские данные, которые имеют 4 категории. Пользователи могут свободно переключаться между различными категориями. Я хотел бы визуализировать последние три или четыре переключателя для каждого человека.

Таким образом, мы начнем с графика с колонкой с 4 сложенными пропорциями. После этого у нас будет 16, поскольку каждая категория разбивается на то, что люди делали в предыдущем случае, затем 64 и так далее, пока корзины не станут слишком маленькими, чтобы быть полезными.

Я думаю, что где-то между диаграммой маримекко и сложенным столбцом диаграммы или грамма дендро должно сработать, но я даже не знаю, как это будет называться!

Если кто-то может помочь с типом сюжета, который я должен использовать, и, если вы хотите быть очень хорошим, как реализовать его в R, то я был бы очень благодарен.

Саймон Хейворд
источник
А как насчет сетевого анализа? en.wikipedia.org/wiki/Social_network#Social_network_analysis
Роман Луштрик,
Правильная идея, но неправильные данные для этого. Я хочу получить столбец с пропорциями, затем итерационно разбить каждую пропорцию, чтобы показать предшественников.
Саймон Хейворд
1
Соответствует ли порядок переключателей? Я думаю, что вы могли бы просто иметь 12 различных значений: число, которое сделало переключение (в любой момент времени) с кат. 1 на 2, 3 или 4, кат. От 2 до 1, 3 или 4 и т. Д. Затем вы можете визуализировать это с помощью четырех кружков для разных категорий и стрелок, идущих назад и вперед между кружками, и относительного размера стрелок, показывающих количество переключателей.
Джонатан
Конечно, если порядок релевантен, вы можете сделать эту же графику для каждого момента времени. Изменяющийся размер кружков будет отображать изменения в каждой категории с течением времени.
Джонатан

Ответы:

11

Одной из возможных идей является использование диаграмм Санки для документирования потока выбора между категориями. Два примера, чтобы описать то, о чем я говорю:


С обновлением по некоторым из ваших проблем, выраженных в комментариях. Мне кажется, что программа Parallel Sets делает то, что вы хотите из коробки. Ниже приведен вывод программы, в которой я создал 4 случайные величины с 4 категориями. Любая группа, которую вы инициализируете в верхней части экрана, будет последовательно разделена между последующими категориями. Создание раскола, что вы хотите.

введите описание изображения здесь

Также на этой картинке не видно, что пакет имеет некоторые интерактивные функции, которые упрощают анализ данных, например, когда вы наводите курсор мыши на одну из категорий, выделяются все его потомки.

Я загрузил в Fineo тот же набор данных, с которым вы можете ознакомиться здесь . Помимо начальных 4 категорийных переменных (названных dec1по dec4), я также включил объединенные категории, которые позволяют вам исследовать разделенные категории. Соглашение об именовании переменных с expсуффиксом заключается в том, что эта decпеременная расширяется путем объединения предыдущих выбранных категорий. Так dec3_exp12будет помечено как 121будто dec1 = 1 and dec2 = 2 and dec3 = 1. Вы можете создать ту же структуру с разделением типов в Fineo, которая доступна в ParSets, но в этом примере не удается отобразить категории с или более узлами.43

После игры с Fineo abit more это отличное приложение, но оно действительно ограничено. Параллельные наборы обладают гораздо большей функциональностью, поэтому я бы посоветовал вам проверить это перед приложением Fineo.


Я думаю, что программа ParSets - намного лучший вариант, чем последовательное разбиение категорий на подмножества для проверки. Например, с использованием тех же случайных данных, что и выше, приведен точечный график, на котором изображены категории пропорций в decision 2выбранной условной категории для выбранной категории decision 1.

введите описание изображения здесь

Вы можете сделать ту же разбивку для изменения с decision 2на decision 3, но составить небольшой многократный график для того, что было начальным decision 1.

введите описание изображения здесь

Вы можете продолжать это бесконечно (см. Ниже). Это может быть поучительно, но я подозреваю, что к тому времени, когда вы доберетесь до многих других панелей, это будет довольно устрашающе. Ниже по запросу визуализируется 4 последовательных выбора категорий.

введите описание изображения здесь

Как отмечалось ранее, небольшие цифры к тому времени, когда вы разбиваете графику на множество категорий, проблематичны. Один из способов объяснить это - сопоставить эстетику, такую ​​как размер, с базовой линией, на которой основывается пропорция. Это сокращает наблюдения, основанные на меньших числах из поля зрения. Вы также можете использовать прозрачность (но я уже сделал точки прозрачными, чтобы различать точки с наложением в этом примере).

введите описание изображения здесь

Я предполагаю, что некоторые представляли структуру узла, похожую на рождественскую елку, в отличие от точечных графиков, но я не знаю, как сделать такую ​​графику. Я подозреваю, что это будет подозрительно к той же самой непреодолимой проблеме все же. Эти небольшие коэффициенты неплохие, но IMO «Параллельные наборы» намного более интуитивен, и я подозреваю, что некоторые неочевидные шаблоны были бы более очевидными в этой визуализации. Может быть, кто-то более изобретательный, чем я, может предложить более интересные данные, чем просто 4 случайные категории.

Энди У
источник
Это выглядит очень полезным, спасибо.
Саймон Хейворд
1
@SimonHayward, опубликуйте несколько примеров, если у вас появятся более интересные визуализации.
Энди W
Хм, на самом деле, я думаю, что это не сработает. Поскольку классы в каждой из 5 категорий одинаковы, это объединит объекты вместе, в то время как я хочу, чтобы они делились все более и более тонко. Так что я должен снять ответ! Я даже не могу оценить ваш ответ в МО! Но пост был интересным и полезным в любом случае!
Саймон Хейворд
Вроде как ориентированный граф с узлами на каждом уровне, расщепление вниз. С каждой ветвью взвешивается. Проблема в том, что я не знаю название того, что я прошу, поэтому затрудняюсь ответить на этот вопрос!
Саймон Хейворд
2
@SimonHayward, я обновил еще несколько примеров. Похоже, что приложение Parallel sets имеет желаемое поведение в отличие от приложения Fineo.
Энди W