Через этот сайт я недавно обнаружил диаграммы Санки, отличный способ визуализировать то, что происходит в традиционной блок-схеме.
Вот хороший пример диаграммы Санки Джорджа М. Уайтсайда и Джорджа В. Крэбтри , источник; Не забывайте долгосрочные фундаментальные исследования в области энергетики , науки 9 февраля 2007: Том. 315. нет. 5813, с. 796 - 798.
После того, как я понял, что R-пакета Sankey не было, я нашел R-скрипт онлайн , к сожалению, этот скрипт довольно сырой и несколько ограниченный. С большими надеждами я попросил R-пакет Sankey или более зрелую функцию в stackoverflow , но, к моему удивлению, кажется, что у нас нет зрелой функции для построения диаграмм Sankey в R.
После того, как я опубликовал награду, Geek On Acid был достаточно любезен, чтобы предложить небольшой взлом существующего скрипта, который заставил его работать более или менее для моей конкретной цели.
Улучшенный R-скрипт создал эту диаграмму Source; stackoverflow.com .
Но указывает ли отсутствие пакета R на то, что диаграммы Sankey Diagrams не являются таким удивительным способом визуализации истощения с использованием R в потоке данных, как показано на диаграмме выше (см. Первоначальный вопрос о переполнении стека для данных и кода R. Возможно есть лучший способ визуализировать истощение.
Как вы думаете, что является лучшим способом визуализации истощения в потоке данных с использованием R?
источник
Ответы:
Я согласен с @gung. Думаю, вы опубликовали диаграмму Сэнки, которая является хорошим примером того, как техника может помочь. Хотя это сложно, контекст (вход и выход энергии) также сложен, и трудно придумать более хороший способ визуализации путей ввода-вывода-действия-новых-входов в нескольких категориях использования.
Итак, для примера истощения, который вы опубликовали, как уже отмечали другие, бесполезно использовать диаграмму Санки. Я думаю, что вам нужно опубликовать полный набор переменных, если вы хотите получить хорошую рекомендацию по альтернативным визуализациям. Если вы просто хотите показать различия в источниках истощения между сайтами и клиницистами, серия точечных графиков с небольшим кратным числом может быть проще для вашей аудитории, чтобы понять и для вас реализовать ( см. Этот пример , где в вашем случае группы могут быть сайты, элементы внутри групп будут причиной истощения, а горизонтальная ось будет 0-100%).
Если вы хотите использовать диаграмму Санки, и вы хотите поиграть на другом языке высокого уровня, в галерее есть хороший пример (с кодом) для пакета печати Python, matplotlib.
источник
Я не обязательно предположил бы, что отсутствие метода подразумевает, что метод не важен или бесполезен. В конце концов, для всех методов, которые в настоящее время существуют в R, было время (вполне возможно, недавнее - R всего ~ 10 лет), когда не было пакета для него.
Однако я должен подумать, что существует множество способов визуализации данных, таких как истощение. Моя первая мысль, глядя на ваш график, заключается в том, что он может быть представлен точечным графиком . Существуют и другие возможности. Дополнительные функциональные возможности диаграммы Санки вступят в действие, когда у вас будет некоторое истощение из-за определенной причины в одной точке, а затем еще больше из-за той же причины позже с другими входами и выходами между ними. Это было бы сложнее представить стандартными графиками (также сложнее следить даже за диаграммой Санки - например, для того, чтобы прочитать верхнюю часть страницы, требуется много работы). Поскольку у вас этого нет, диаграмма Сэнки кажется довольно красивой, но излишней.
источник
Как насчет использования кода R для написания SVG-файла с шириной стрелки, установленной в соответствии с вашими данными, и простой компоновкой. Затем загрузите в Inkscape и согните стрелки вокруг, добавьте ярлыки и т. Д. К своему сердцу, чтобы сделать что-то красивое.
Очевидная проблема: вам нужно повторить все ваши предварительные настройки в Inkscape, если ваши данные изменятся (хотя вы можете использовать ваш симпатичный SVG из Inkscape в качестве шаблона и просто подставить новую ширину стрелки).
Но, честно говоря, если бы этот разноцветный беспорядок из замаскированных вверх ногами был хорошей диаграммой Санки, я бы не хотел видеть плохой на полном желудке [хотя, глядя на него еще несколько минут, я понял о чем идет речь, хорошей графике это не нужно].
источник