Я видел этот пост на Moz, который представил сегментированную маркетинговую воронку:
Такие вещи будут иметь большую ценность в моей работе. Я понятия не имею, как визуализировать необработанные данные, чтобы показать сегментированную воронку, подобную этой. Идея состоит в том, что коммерческие предложения поступают из разных источников (которые мы используем для сегментирования данных) и проходят несколько этапов к тому времени, когда они преобразуются в сделку. От каждого этапа к другому некоторые отпадают. Ширина каждого среза определяется абсолютным количеством отведений в каждом. [ РЕДАКТИРОВАТЬ : обратите внимание, что изображение, используемое здесь для справки, вводит в заблуждение, когда речь идет о числах, указанных справа от каждого среза. Кажется, нет никакой связи между шириной среза и числом. Изображение должно быть взято только как ссылка на конструкцию сегментированной воронки].
В любом случае, есть идеи, как это визуализировать? Если возможно, я бы хотел иметь способ сделать это в Python.
Вот Google Doc с некоторыми фиктивными данными, если кому-то нужны ...
Ждем ваших идей. Спасибо!
источник
Ответы:
На этом графике показана двусторонняя таблица непредвиденных обстоятельств , данные которой приблизительно такие:
Есть множество способов построить этот сюжет. Например, вы можете рассчитать положение каждого прямоугольного цветного пятна и отдельно разместить каждый участок. В целом, однако, это помогает найти краткое описание того, как график представляет данные.
В качестве отправной точки мы можем рассматривать этот вариант как вариацию столбчатой диаграммы с накоплением.
Этот график едва ли нуждается в описании: благодаря знакомству мы знаем, что каждый ряд прямоугольников соответствует каждому ряду таблицы сопряженности; что длины прямоугольников прямо пропорциональны их количеству; что они не перекрываются; и что цвета соответствуют столбцам таблицы.
ggplot2
R
Детали графики, такие как ширина ряда столбцов и используемые цвета, как правило, должны быть четко указаны. Как это сделать, зависит от графического окружения (и поэтому это не представляет особого интереса: вам просто нужно посмотреть).
Эта конкретная реализация грамматики графики обеспечивает небольшую гибкость в позиционировании полос. Один из способов создать желаемый вид с минимальными усилиями - это вставить невидимую категорию в основание каждого стержня так, чтобы столбцы были отцентрированы. Немного подумав, можно предположить, что фальшивое число, необходимое для центрирования каждого бара, должно быть средним от общей длины бара и длины самого длинного бара. Для этого примера это будет начальный столбец со значениями
Вот итоговая столбчатая диаграмма, на которой показаны поддельные данные светло-серого цвета:
Нужная фигура создается, делая графику для поддельного столбца невидимой:
Грамматика графики описанию сюжета не нужно менять: мы просто поставили другую таблицу на случае непредвиденных обстоятельств , которая будет предоставляться в соответствии с тем же описанием (и отменяет назначение цвета по умолчанию для столбца поддельного).
Комментарии
Эти графики честны: горизонтальная протяженность каждого цветного пятна прямо пропорциональна исходным данным, без искажений. Сравнение их с оригиналом (в вопросе) показывает, насколько экстремальным является его искажение ( Фактор Лжи Туфте ).
Если необходимо отобразить детали в нижней части «воронки», рассмотрите возможность представления количества по площади, а не по длине. Вы можете сделать длины стержней пропорциональными квадратным корням из общей длины, а их ширины (в вертикальном направлении) также пропорциональными квадратным корням. Теперь дно «воронки» будет иметь длину около одной двадцатой по длине, а не одну четвертую часть, что позволяет показать некоторые детали. К сожалению,
ggplot2
реализация не позволяет отобразить переменную на ширину стержня, поэтому необходим более сложный обходной путь (который действительно описывает каждый прямоугольник отдельно). Возможно, есть реализация Python, которая более гибкая.Ссылки
Эдвард Туфте, Визуальное отображение количественной информации . Чешир Пресс, 1984.
Лиланд Уилкинсон, Грамматика графики. Springer 2005.
источник
Вы можете попытаться использовать сюжетно сегментированную воронку в Python для его построения. Вот учебник: https://moderndata.plot.ly/segmented-funnel-charts-in-python-using-plotly/
Надеюсь это поможет.
источник