Я пытаюсь визуализировать некоторые потребительские данные, которые имеют 4 категории. Пользователи могут свободно переключаться между различными категориями. Я хотел бы визуализировать последние три или четыре переключателя для каждого человека.
Таким образом, мы начнем с графика с колонкой с 4 сложенными пропорциями. После этого у нас будет 16, поскольку каждая категория разбивается на то, что люди делали в предыдущем случае, затем 64 и так далее, пока корзины не станут слишком маленькими, чтобы быть полезными.
Я думаю, что где-то между диаграммой маримекко и сложенным столбцом диаграммы или грамма дендро должно сработать, но я даже не знаю, как это будет называться!
Если кто-то может помочь с типом сюжета, который я должен использовать, и, если вы хотите быть очень хорошим, как реализовать его в R, то я был бы очень благодарен.
источник
Ответы:
Одной из возможных идей является использование диаграмм Санки для документирования потока выбора между категориями. Два примера, чтобы описать то, о чем я говорю:
С обновлением по некоторым из ваших проблем, выраженных в комментариях. Мне кажется, что программа Parallel Sets делает то, что вы хотите из коробки. Ниже приведен вывод программы, в которой я создал 4 случайные величины с 4 категориями. Любая группа, которую вы инициализируете в верхней части экрана, будет последовательно разделена между последующими категориями. Создание раскола, что вы хотите.
Также на этой картинке не видно, что пакет имеет некоторые интерактивные функции, которые упрощают анализ данных, например, когда вы наводите курсор мыши на одну из категорий, выделяются все его потомки.
Я загрузил в Fineo тот же набор данных, с которым вы можете ознакомиться здесь . Помимо начальных 4 категорийных переменных (названных43
dec1
поdec4
), я также включил объединенные категории, которые позволяют вам исследовать разделенные категории. Соглашение об именовании переменных сexp
суффиксом заключается в том, что этаdec
переменная расширяется путем объединения предыдущих выбранных категорий. Такdec3_exp12
будет помечено как121
будтоdec1 = 1 and dec2 = 2 and dec3 = 1
. Вы можете создать ту же структуру с разделением типов в Fineo, которая доступна в ParSets, но в этом примере не удается отобразить категории с или более узлами.После игры с Fineo abit more это отличное приложение, но оно действительно ограничено. Параллельные наборы обладают гораздо большей функциональностью, поэтому я бы посоветовал вам проверить это перед приложением Fineo.
Я думаю, что программа ParSets - намного лучший вариант, чем последовательное разбиение категорий на подмножества для проверки. Например, с использованием тех же случайных данных, что и выше, приведен точечный график, на котором изображены категории пропорций в
decision 2
выбранной условной категории для выбранной категорииdecision 1
.Вы можете сделать ту же разбивку для изменения с
decision 2
наdecision 3
, но составить небольшой многократный график для того, что было начальнымdecision 1
.Вы можете продолжать это бесконечно (см. Ниже). Это может быть поучительно, но я подозреваю, что к тому времени, когда вы доберетесь до многих других панелей, это будет довольно устрашающе. Ниже по запросу визуализируется 4 последовательных выбора категорий.
Как отмечалось ранее, небольшие цифры к тому времени, когда вы разбиваете графику на множество категорий, проблематичны. Один из способов объяснить это - сопоставить эстетику, такую как размер, с базовой линией, на которой основывается пропорция. Это сокращает наблюдения, основанные на меньших числах из поля зрения. Вы также можете использовать прозрачность (но я уже сделал точки прозрачными, чтобы различать точки с наложением в этом примере).
Я предполагаю, что некоторые представляли структуру узла, похожую на рождественскую елку, в отличие от точечных графиков, но я не знаю, как сделать такую графику. Я подозреваю, что это будет подозрительно к той же самой непреодолимой проблеме все же. Эти небольшие коэффициенты неплохие, но IMO «Параллельные наборы» намного более интуитивен, и я подозреваю, что некоторые неочевидные шаблоны были бы более очевидными в этой визуализации. Может быть, кто-то более изобретательный, чем я, может предложить более интересные данные, чем просто 4 случайные категории.
источник