Это вопрос визуализации данных - надеюсь, здесь можно задать этот вопрос.
Когда целесообразно использовать заливку под линейным графиком для временного ряда, как на графике ниже? (который показывает время пинга за день)
Я предполагаю, что более распространенным является использование простой линии без заливки внизу, но нормально ли использовать заливку для визуального разнообразия?
Мне было бы особенно интересно узнать о каких-либо исследованиях восприятия темы или о каких-либо руководствах по стилю.
data-visualization
Ричард
источник
источник
0s
нижняя граница естественная, и вы показываете ее, то почему бы и нет?Ответы:
В балансе эстетики и информативности графики есть немного искусства. Известные консультанты по визуализации / авторы, такие как Эдвард Туфте и Стивен Фью, выбирают минимальную эстетику, которая позволяет избежать отвлечения от информативных частей графика. Тем не менее, для некоторых зрителей оправдано небольшое количество процветания - см., Например, журналистское применение визуализации данных Альберто Каиром.
Угол исследования восприятия состоит в том, что каждый графический элемент передает сообщение, то, что мы не осознаем сознательно, потому что наш визуальный кортекс имеет дело с ним (« предварительная обработка »). Дополнительные элементы, даже избыточные, могут привести к дополнительной обработке. Соответствующий график зависит от сообщения, которое необходимо передать, и аудитории.
К вашему конкретному вопросу, связанная линия подчеркивает тренд (и отклонение от тренда). Заполненная область подчеркивает отклонение от базовой линии. Гистограмма или стрелочная диаграмма будут выделять отдельные события, отклоняющиеся от базовой линии.
Графический контекст также важен. Если у вас есть сетка плотно упакованных графиков, заливка поможет связать каждую линию с ее базовой линией.
Наконец, еще одно соображение по поводу добавления избыточных графических элементов / цветов - это затрудняет расширение графа более информативными элементами. Например, вы можете выделить специальные значения, наложить другие линии тренда или наложить полосы, например, в следующем макете.
источник
Еще пара моментов для рассмотрения:
Как упомянуто в комментарии, недостаточное заполнение в значительной степени не подходит, если ось x не находится в точке с нулевым естественным y. Это может быть связано с тем, что ось y масштабируется так, чтобы начинаться с номера, отличного от нуля, или из-за того, что используемые единицы не имеют интерпретации с естественным нулем (например, у Кельвина есть естественный ноль, а у Цельсия - нет).
Во-вторых, случай, когда недостаточное заполнение является особенно допустимым, - это если сами данные можно считать недостаточно заполненными. Например, линейный график высоты горы имеет смысл не заполнять, цвет заливки представляет землю, а незаполненный представляет воздух.
Связанный пример может быть данными подсчета. Если бы мы сложили всех людей в каждой точке х, мы получили бы гистограмму. Если интерполяция между барами имеет смысл, мы получим линейный график с недостаточным заполнением.
Это изображение из «визуального отображения количественной информации» может объяснить это немного лучше. Это показывает, какие воинские части были в Европе во время второй войны (я думаю). Расстановка юнитов в каждый момент времени дает вам недостаточно заполненную гистограмму. Рисование линии поверх данных дает вам недостаточно заполненную линейную диаграмму.
источник
Предыдущие два ответа охватывают основные важные моменты, но есть несколько вещей, которые все же следует упомянуть.
Во-первых, я должен сказать, что я не согласен с экстремальным минималистским подходом к графике - все лишние чернила должны исчезнуть. Отвлекающие, бессмысленные вариации должны идти. Но сплошная область по сравнению с одной линией может лучше заметить и больше общаться с первого взгляда. И, как вы говорите, это может добавить «визуальное разнообразие».
Однако, как указывает @xan, этот быстрый взгляд также интерпретирует область иначе, чем линия, в некоторой степени частично подсознательно.
Граф области подразумевает общее количество, которое накапливается по мере продвижения вдоль оси X. Если вы сравните два графика, и на одном из них будет заполнена большая область, ваш взгляд скажет вам, что он имеет большую сумму независимо от начального и конечного значений.
Напротив, линейный график показывает изменение значения. Основное внимание уделяется изменению положения от одной точки к другой, а не общей сумме.
Итак, когда вы должны использовать граф области?
Идея состоит в том, что при чтении графика, если вы берете две точки на оси x, область, показанная между ними, должна представлять фактическое количество чего-то, накапливающегося в этом диапазоне. По этой причине, если ваши значения включают отрицательные суммы, я бы рекомендовал использовать противоположные цвета для отрицательных и положительных областей, чтобы подчеркнуть, что они сводятся к итоговой сумме.
Когда вы должны не использовать область графика?
Учитывая эти рекомендации, ваш граф ping может быть интерпретирован двумя способами.
С одной стороны, если вы думаете о скорости пинга как о единственной переменной, которая меняется в течение дня, тогда наиболее подходящим будет простой линейный график.
С другой стороны, если вы сравнивали суточные значения скорости пинга двух разных сетей (или одну и ту же сеть в разные дни / периоды времени), то, возможно, вы захотите выделить общее количество времени, необходимое для сетевых задач. Например, если ваш график имеет несколько пиков, а не один, линейный график будет подчеркивать изменчивость скорости, в то время как график области будет выделять общую задержку.
Сравните:
совокупный итог немного больше в первой половине графика (слева от красной линии), чем во второй, даже если пики достигают более высоких максимальных значений справа. Заполнение подчеркивает этот сплошной блок слева, так что он лучше балансирует против пиков.
(Простите за плохое качество изображения - не мог понять, как заставить R сделать граф области! Пришлось экспортировать и редактировать отдельно.)
источник