Должна ли площадь или длина квадрата быть пропорциональны визуализируемым данным?

16

Я делаю визуализацию данных. Каждый элемент представлен квадратом. Чтобы сделать базовые данные интуитивно понятными, длина стороны каждого квадрата или площадь каждого квадрата должны быть пропорциональны данным, которые они представляют?

dumbledad
источник
1
Еще нет. Это широко? Я надеялся, что ответ был определенным (я предполагаю, что это «область»), но у этого народа было бы больше графического дизайна и знаний в области психологии восприятия, чтобы подтвердить это.
Дамблдад
1
IIRC это было описано в немецкой книге, которую я однажды прочитал под названием «So lügt man mit Statistik» от en.wikipedia.org/wiki/Walter_Krämer - не уверен, что существует английский эквивалент. TL; DR - зависит от того, что вы хотите, чтобы ваши читатели читали из визуализаций.
Михаэль Шумахер
Ответ, конечно, не определен. Все зависит от специфики, а именно от того, какие данные вы представляете, как вы представляете, и что вы хотите общаться с указанными данными.
DA01
Можете ли вы привести примеры, когда специфика или то, что мы хотим, чтобы читатели читали из визуализации, побудили бы нас сделать так, чтобы длина стороны квадрата была пропорциональна элементу, а не площади квадрата?
Дамблдад
5
+1 Почему каждый интересующий вопрос привлекает хотя бы одно закрытое голосование?!? <grump>
user56reinstatemonica8

Ответы:

10

Если вы, создатель, не уверены, как читатель узнает, что это такое?

Краткий ответ: значение должно быть связано 1: 1 с количеством цвета на странице . Так что в вашем примере это должна быть область. Но это еще не все: вам также нужно избегать вводящих в заблуждение подсказок, которые могут заставить читателя читать его неправильно, и вам нужно знать, почему вы используете область вместо длины (например, гистограммы), потому что у нее есть реальные плюсы и минусы.


Во-первых, никогда не изменяйте длину и ширину (т. Е. Площадь) изменения формы, когда на самом деле переменная связана только с длиной одной стороны. Если X - двойной Y, но Y имеет в четыре раза больше цвета на странице, вы вводите своих читателей в заблуждение. Такое искажение иногда называют « фактором лжи », и часто предполагается, что оно является преднамеренной попыткой ввести в заблуждение и преувеличить различия.

введите описание изображения здесь


Если вы используете площадь в качестве меры, я настоятельно рекомендую:

  • Зная, почему вы используете область . Используя область вместо линейного размера, такого как длина, вы:

    • Пожертвуйте способностью ясно видеть различия математически (вы не можете легко сказать «смотри, это вдвое больше другого»)
    • Предложите своим читателям в интуитивно понятном повседневном нечисловом виде увидеть, как люди, например, сравнивают размеры пирогов в магазине. Менее изощренный, но более непосредственный. Больше кишки, меньше головы.
    • Небольшие различия между очень похожими числами становятся почти невидимыми.
    • Когда одна переменная во много раз меньше другой, очень маленькая переменная исчезает не так плохо, как на гистограмме, что может обеспечить большую гибкость в макетах.

введите описание изображения здесь

  • Подумайте об использовании кругов для области, а не квадратов по центру :

    • Круги, потому что это не вызывает путаницы с гистограммами и тому подобным. Высота и ширина меньше на первый план: это выглядит менее похоже на то, что вы предлагаете сравнение на основе высоты или ширины.
    • Выровненный по центру, потому что он не приглашает людей сравнивать высоты

введите описание изображения здесь

Например, выше, трудно не видеть квадрат с надписью «5» как три четверти высоты квадрата с надписью «10», так что это может ввести в заблуждение.

Круги не предлагают такого рода сравнения: это скорее интуитивный уровень, мгновенный «Этот шарик намного больше, чем следующий шарик».


Существует множество свидетельств от пользовательского тестирования до мелкомасштабных исследований (позже мы попытаемся найти некоторые примеры), что такого рода интуитивное сравнение на основе областей может быть более увлекательным, может снизить барьер для входа в менее заинтересованную аудиторию и может помогите сосредоточиться читателю на предмете, а не на холодных подробностях чисел. Но это происходит за счет того, что мы стоим на пути более численного анализа.

Не выбирайте между одномерным (длина или расстояние) и двухмерным (площадь) по эстетическим соображениям: выбирайте между ними в зависимости от вашей аудитории и сообщения.

Что больше подходит для общения: мгновенные сравнения на уровне кишечника на уровне «это намного больше» или более взвешенные численные сравнения на уровне «это примерно 80% от другого»?

Или есть практические причины, почему вам нужно использовать площадь?

Затем, когда вы выбрали по практическим соображениям, применять эстетику.

user56reinstatemonica8
источник
«Пропорционально количеству цвета на странице» является очень полезным эмпирическим правилом (по крайней мере, в 2D); спасибо за это я буду использовать его. Дизайн, к
которому я перехожу,
5

Я бы сказал, область. Оптически квадрат со стороной в два раза длиннее показывает площадь в 4 раза больше. Случайные наблюдатели будут относиться к области, даже не читая вашу легенду.

Хорошим примером является этот легендарный граф Рэндалла Манро из xkcd :

введите описание изображения здесь ( огромная, разборчивая версия )

Винсент
источник
4

Мы не так хороши в оценке различий в области, как мы в длине. Мы используем длину в качестве прокси и поэтому склонны недооценивать различия в областях.

По этой причине круг, который на самом деле в 2 раза больше другого, кажется слишком маленьким, потому что наш мозг соотносит их радиусы, которые отличаются в 1,4 раза.

Существуют интересные попытки примирить этот феномен, например, « Пропорциональное сопоставление символов в R» , которое предлагает перцептивное масштабирование символов для более точного согласования с тем, как мы оцениваем длину и площади.

Вот рис. 2 из этой статьи

введите описание изображения здесь

Лично я не имею никакого опыта в этом и избегаю использования областей, если требуются количественные суждения.

Интересная касательная - это связь между восприятием объема и длины. Разница в том, как мы их воспринимаем, еще более поразительна. Это можно проиллюстрировать на этом видео сравнений размеров звезд .

К тому времени, как вы доберетесь до самой большой звезды, которая примерно в 1700 раз больше диаметра Солнца, у вас останется впечатление, что она намного больше, чем 1700 раз.

Для более систематического взгляда на нашу ошибку в восприятии различий в областях и длинах см. Графическое восприятие краудсорсинга: использование Mechanical Turk для оценки дизайна визуализации Джеффри Хиером и Майклом Бостоком.

Мартин Крживински
источник
4

На мой взгляд, область (D), а не каждая сторона (E).

Если вы используете сторону длины 2, то площадь будет в 4 раза больше значения, и у вас будет очень перекрывающийся график. (Е)

Когда у вас есть нормальная гистограмма (A), данные являются линейными, и с гистограммой только для эстетики. (В)

В этих случаях область снова представляет данные, потому что столбцы одинаковы. Вы можете иметь 3D-бар, и все же объем бара является тот, который представляет данные (C)

Графики, иллюстрирующие различия в восприятии и перекрытия

Рафаэль
источник
4 раза? Разве это не разница между линейным и квадратным?
Дамблдад
Позвольте мне проиллюстрировать и отредактировать пост.
Рафаэль
Предположим, что базовое значение равно 81. Если мы используем область, стороны имеют длину 9, что дает площадь 81. Если мы используем стороны, то они имеют длину 81 и площадь 6 561. 81 не 4 раза 9 и 6 561 не 4 раза 81. Откуда вы получаете 4?
Дамблдад
«Если вы используете сторону длины 2, тогда площадь будет в 4 раза больше значения». Я не могу сказать, что вы пытаетесь сказать. Я думаю, вы имеете в виду, что если вы используете длину стороны для представления величины данных, удвоение значения данных умножает площадь на четыре.
Дэвид Ричерби
Дэвид - это мое редактирование! Оригинальный пост Рафаэля гласил: «Если вы используете сторону, площадь будет в 4 раза больше значения». Если вы знаете лучший способ уточнить это, пожалуйста.
Дамблдад
1

Туфте занимался этим широко. Видеть:

  • Визуальное отображение количественной информации,
  • Предвидение информации и др.

Некоторые принципы графической целостности:

  1. Представление чисел, измеренное физически на поверхности самого графика, должно быть прямо пропорционально представленным числовым величинам.
  2. Четкая, подробная и тщательная маркировка должна использоваться, чтобы победить графическое искажение и двусмысленность. Выпишите объяснения данных на самом графике. Обозначьте важные события в данных.
  3. Показать изменения данных, а не изменения дизайна.
  4. При отображении денег во временных рядах дефлированные и стандартизированные единицы измерения денежной массы почти всегда лучше, чем номинальные единицы.
  5. Количество отображаемых информационных (переменных) измерений не должно превышать количество измерений в данных. Графика не должна указывать данные вне контекста.

В вашем случае вы должны спросить себя, лучше ли данные представлены 2D или 3D изображением или линией. Куб, квадрат и линия - это не одно и то же. Это одна из причин, по которой трехмерные гистограммы так часто вводят в заблуждение.

майонез
источник