Каковы основные правила проектирования и производства участков?

19

Фон:

Ранее на Cross Validated у нас были вопросы по:

@David в комментариях к этому вопросу предложил, что у нас должен быть вопрос вики сообщества с одним правилом визуализации на ответ , за который сообщество могло бы голосовать.

Вопрос

Каковы основные правила проектирования и создания графического представления данных?

правила

  • Одно правило на ответ
  • В идеале включите краткое объяснение того, почему вы считаете это хорошей идеей
  • Предпочтение отдается ответам с примерами (кода и изображения) хорошей и плохой практики.
Jeromy Anglim
источник

Ответы:

13

Вещество над формой : выберите соответствующий график, стиль, цвет или другие графические параметры, чтобы показать, что вы хотите показать на графике, а не то, что обязательно позволяет ваш графический пакет.

фомиты
источник
8
(+1) Я часто предпочитаю сначала набросать график на бумаге, чтобы уменьшить вероятность того, что мои проектные решения будут руководствоваться путем наименьшего сопротивления, созданного графическим программным обеспечением.
Джером Энглим
13

Быть знакомым с тремя измерениями цвета может быть полезным. Если вы используете несколько цветов, они в идеале должны отличаться по нескольким из этих измерений, а не только по одному.

Значение. График должен оставаться читаемым даже в черно-белом режиме. Это простое правило должно учитывать дальтонизм, некачественные принтеры и плохие условия освещения. Даже если вы используете разные оттенки, убедитесь, что значения достаточно разные. В частности, графики должны быть темными на светлом фоне (или наоборот), но не серыми на сером значении. Худшим примером будет синий график на красном фоне - оба являются средними значениями, т. Е. Дают очень похожие оттенки серого после преобразования в черно-белое изображение.

Насыщенность. Насыщенность следует использовать с умеренностью: чистая красная линия может быть хорошей, но более толстая, менее насыщенная красная линия будет более удобочитаемой (увеличенная толщина помогает различать цвета и позволяет уменьшить насыщенность). С другой стороны, на чистую красную область больно смотреть: не используйте насыщенные цвета для заполнения областей. В цветовой палитре Брюера (предназначенная для карт, а не построчно участков) дают примеры низкой насыщенность цвета выбор. Худшим примером будет снова насыщенный фон (синий на красном или красный на синем).

Hue. Как упомянул @gung, избегайте сочетания красный / зеленый (светофор): людей с дальтонизмом гораздо больше, чем вы думаете. Особенно с оттенком, меньше значит больше. Например, для построения «расходящихся» значений (т. Е. Величин, которые могут быть положительными или отрицательными), используйте только два оттенка (для положительных и отрицательных значений), чтобы читатель мог сразу различить, что является высоким, а что - низким. Использование дискретного градиента может привести к гораздо более удобочитаемому графику: границы между цветами становятся видимыми и образуют контурный график.

Вы можете прочитать « Практические правила использования цвета в диаграммах» С. Фью или обратиться к любому материалу «Теория цвета» для студентов, изучающих искусство или дизайн.

Vincent Zoonekynd
источник
+1, хорошая информация здесь. Ваше мнение о ценности и о том, как цвета будут отображаться после преобразования в черный и белый, особенно хорошо. Также полезна ссылка на статью «Немногие». Одно замечание: лучше не называть другие ответы «выше», вместо этого используйте @ so-and-so; ответы перемещаются в зависимости от того, сколько голосов они получили.
gung - Восстановить Монику
11

Разместите как можно больше необходимой информации внутри самой фигуры. Не требуйте от читателя ссылки на подпись, например, для определения значения различных символов или цветов. Поместите в заголовок любую информацию (или дополнительную информацию), которая не может быть включена в сам рисунок. Идея состоит в том, чтобы минимизировать усилие, требуемое средством просмотра графика, для извлечения соответствующей информации --best: график не требует пояснений, следующий лучше: требуемая дополнительная информация может быть быстро найдена из заголовка, худший: зритель должен внимательно прочитать Весь раздел результатов поиска некоторых важных деталей, чтобы выяснить, что происходит.

David
источник
1
+1, и мы можем расширить эту идею дальше: мы хотим сделать так, чтобы люди могли видеть график и знать (насколько это возможно), что происходит, не читая заголовок, а также когда им нужна дополнительная информация для имейте это в заголовке так, чтобы люди могли прочитать заголовок и знать, что им нужно, не читая бумаги в поисках этой важной детали.
gung - Восстановить Монику
1
@ Gung, так как это CW, пожалуйста, не стесняйтесь редактировать ответ, чтобы отразить ваши комментарии.
Дэвид Лебауэр
10

Сделайте сюжет максимально простым. По словам Туфте, «минимизируйте соотношение данных и чернил».

Например, избегайте:

  • больше цветов или форм, чем требуется
  • больше отметок, чем необходимо
  • 3-D эффекты на 2-D графике.
  • используя легенду, когда объекты могут быть помечены напрямую
Дэвид Лебауэр
источник
Я не согласен с Tufte здесь. Во-первых, большая часть мотивации для этого правила в его оригинальной книге, это то, сколько времени вам нужно потратить на рисование лишних, ненужных линий; но это не имеет значения сегодня. Во-вторых, реальная идея лучше уловлена ​​правилом Кливленда, чтобы максимизировать информативность графики, поскольку иногда сюжет может стать более информативным с большим количеством чернил, но оба правила запрещают чартджанк, оскорбляющий Туфте.
gung - Восстановить Монику
@gung, где были усилия и время, представленные Tufte в качестве мотивации. Я не вспоминаю эту часть (но у меня также нет текста под рукой).
Дэвид Лебауэр
1
У меня его тоже нет, но в его 1-й книге « Визуальное отображение» я помню, как он говорил о том, сколько раз вам приходилось ставить линейку, чтобы нарисовать график. Может быть, "большой" был преувеличением, но я помню, как читал это и думал: "кого это волнует сейчас?" В « Элементах» Кливленд приводит убедительный аргумент, что правило Туфте ошибочно. Он утверждает, что цель состоит в том, чтобы максимизировать передачу информации, и показывает, что этот принцип также устраняет то, что Tufte не нравится, но учитывает случаи (которые он показывает), где дополнительные чернила, не связанные с данными, помогают сделать график более информативным.
gung - Восстановить Монику
Я должен ясно дать понять, я не согласен с некоторыми конкретными предложениями (например, без 3D, без чартджанка); Я не согласен с правилом Туфте в качестве руководства для графики.
gung - Восстановить Монику
@gung Я интерпретировал ту же самую дискуссию как эвристический инструмент - простой способ для читателя понять подход, а не способ уменьшить работу дизайнера.
Дэвид Лебауэр
9

Оставьте время для редактирования. Создание хорошего графика требует времени и часто (по крайней мере, для меня) многократных попыток.

Питер Флом - Восстановить Монику
источник
6

Не против красного и зеленого. Цвет может быть полезен, но при использовании цвета всегда имейте в виду, что значительное меньшинство людей имеют красно-зеленые дальтоники. Однажды я показывал кому-то некоторые данные, и он не мог разглядеть, что происходит на моих графиках - это была пустая трата времени, и я чувствовал себя довольно глупо. Другие формы дальтонизма встречаются очень редко, но красно-зеленые встречаются довольно часто. Эта страница содержит много полезной информации. Вот несколько советов:

  • Если вам нужны только два цвета, используйте синий и желтый - не используйте красный и зеленый.
  • Если вам нужен градиент, переходите от синего к желтому при одновременном изменении насыщенности и яркости - не используйте радугу.
  • Если вам нужно закодировать более двух элементов (например, точки на диаграмме рассеяния из более чем двух групп или нескольких линий), добавьте в свои цвета различные символы построения / стили линий. Например, отдельные символы построения: o + <sw или линии: сплошные, пунктирные, пунктирные, пунктирные и т. Д. (Вы также можете добавить символы построения к своим линиям или изменить вес линий).
Гунг
источник
Это действительно то, что я часто задавался вопросом: какой цветовой градиент лучше всего использовать?
Штеффен
4

Не используйте сложенные гистограммы. И на связанной ноте, если у вас есть элемент шкалы Лайкерта, не нужно показывать пропорцию для каждого ответа на каждый элемент. Эти графики заставляют мои глаза кровоточить.

Не используйте круговые диаграммы.

Не дублируйте данные, содержащиеся в графе, бросая в таблицу.

Используйте шрифт без засечек, такой как Arial, для заголовков графиков и т. Д., Поскольку эти типы шрифтов предназначены для использования таким образом.

Ни один пост о дизайне не обходится без справочника, мне очень нравятся статистические правила большого пальца . Глава 9 имеет отношение к обсуждению здесь, и к битам, на которые я указываю, когда меня спрашивают, почему я ненавижу гистограммы и круговые диаграммы. :)

Признание: в одной из моих первых студенческих консультационных ролей для небольшого клиента из НПО я дал им отчет, в котором было много гистограмм, напечатанных в цвете (это было в середине 1990-х). Я думаю, что мне удалось получить желтый, фиолетовый и красный в этих щенков.

Мишель
источник
3

Не связывайтесь с топорами. Не обрезайте первые сто единиц только потому, что тогда наклон графика выглядит более впечатляюще. Изображение прилипнет, и люди запомнят гораздо больший эффект, чем был измерен.

xmjx
источник
2
Отрезание данных для изменения видимого наклона является мошенническим. OTOH, есть реальный вопрос о том, должны ли оси всегда включать 0, и (несколько менее связаны) используемое соотношение сторон. Кливленд приводит веские аргументы в пользу того, что графики более информативны, если вы максимизируете данные в окне данных и наклоняет «банк» до 45 градусов. Знайте свою аудиторию здесь: Кливленд утверждает, что профессиональная аудитория должна восприниматься как компетентная и грамотная, но с наивной аудиторией либо явно указывайте эти особенности и объясняйте их, либо (возможно) не используйте их.
gung - Восстановить Монику
Даже профессиональная аудитория (я полагаю) через несколько месяцев вспомнит только крутую линию на графике и забудет перехват и все остальное. Вы можете получить все эти данные на (плоском) графике, правильно пометив экстремальные значения, и при этом у вас останется информация, что на самом деле ничего не изменилось за время.
xmjx
2
Я не согласен. Я не думаю, что это разумное правило - настаивать, чтобы все оси начинались с нуля, если это то, что предлагается. Графика должна показывать вариации и структуру данных - если важно колебание 100 000 вокруг значения двух миллионов (и, возможно, как оно отличается между двумя группами), то на графике должно быть показано, что «два миллиона не является большим числом». ».
Питер Эллис
Как и в случае с любым правилом дизайна, я думаю, что это то, что вы можете нарушить, если действительно понимаете практическую значимость предложенного варианта и то, как ваша аудитория его интерпретирует. Но это правило нарушается настолько часто и настолько вопиюще, что я думаю, что довольно безопасно громко провозгласить: «Все участки должны включать ноль! *». Поиск в Google американских домовладельцев неплохо иллюстрирует эту точку зрения - почти на каждом участке похоже, что домовладение колебалось дико за последние два десятилетия, когда на самом деле максимальный разброс составляет около 5%.
Мэтт Паркер
Не то, чтобы 5% не имели значения - и большинство этих графиков связаны с аргументами о последствиях политики, которая вызвала это колебание. Но я думаю, что эти аргументы были бы еще более убедительными, если бы они подчеркнули, как масштабная политика с огромными экономическими последствиями фактически оказала относительно небольшое влияние на домовладение.
Мэтт Паркер