Как называется этот участок, используя вертикальные линии, чтобы показать распределение?

14

Есть ли официальное название для этого чрезвычайно простого графика, в котором вертикальные линии указывают распределение некоторых выборок в диапазоне?

введите описание изображения здесь

январь
источник
8
«коврик», когда используется с другими участками.
Gimelist
7
Официального названия нет. Многое зависит от того, является ли необходимым использование вертикальных линий или будут приняты другие символы, а также от того, допускается ли наложение или дрожание при наличии связей. На stats.stackexchange.com/questions/102735/… я приведу 22 разных названия, которые можно найти в более широком смысле этого сюжета.
Ник Кокс

Ответы:

24

Первым примером, на который я видел их упоминание, являются полоски, отображающие эмпирические распределения: I. текстурированные точечные полоски (Tukey and Tukey, 1990), хотя я так и не смог получить этот технический отчет.

Тим прав: их часто сопровождают в виде коврика на дополнительном сюжете, чтобы показать местоположение отдельных наблюдений, но сюжет коврика немного более общий, и этот тип сюжета не всегда находится на коврике другого сюжета, как показывает ваш вопрос!

  • Вот пример использования точек на коврике вместо линий.
  • Вот пример того, как ковер является точками и отображает не все данные, а только данные, отсутствующие в другом измерении диаграммы рассеяния.

Таким образом, сюжет коврика не всегда представляет собой набор линий на границах другого графика, и этот тип графика в вашем вопросе не всегда находится на полях другого графика. Вот пример линий, наложенных на плотность ядра, а не на ковер сюжета, называемых beanplot . Я полагаю, что более крупные линии используются для визуализации различных квантилей (или буквенных значений) распределения.


(источник: biomedcentral.com )

В Грамматике графики Уилкинсона это можно считать одномерной диаграммой рассеяния, но с использованием линейных сегментов вместо типичных значений по умолчанию для окружностей. Смысл этого состоит в том, чтобы предотвратить наложение многих соседних точек. Если у вас есть много точек и они нарисованы полупрозрачно, они в конечном итоге превратятся в полосу плотности, см. Окончательный рисунок в этом посте .

Я даже видел, как они предложили использовать в этом примере в качестве спарклайнов ( Greenhill et al., 2011 ) для визуализации двоичных данных. Гринхилл называет их в этом примере графиками разделения , и вот пример, взятый из ссылочной статьи (стр.995):

введите описание изображения здесь

Таким образом, в этом примере есть значения вдоль всей оси, а цвет используется для визуализации двоичной переменной. Черная линия на этом графике представляет собой совокупную долю красных наблюдений.

Энди У
источник
6
+1 Стрип-сюжет - тоже общий термин.
whuber
1
@whuber: Стриптиз, да, или стриптиз .
говорит амеба: восстанови Монику
1/nnn
Это справедливое описание @NickCox, но я не думаю, что разделительные участки такие разные. В грамматике Уилкинсона это можно рассматривать как одномерную диаграмму рассеяния с рангом в одном измерении, а затем с использованием цвета для различения двух типов точек. Имея только два типа точек, вам даже не нужно иметь данные для одного из наборов, поэтому исходный график ОП мог бы быть разделительным графиком с черными полосами, отображающими одну категорию, и фоном, серым - дополнение.
Энди У,
Это не так сильно отличается от некоторых спарклайнов, которые я видел для визуализации побед / поражений спортивных команд. (Все графики должны быть сопоставлены с конечным интервалом, чтобы проецировать данные на экран страницы / компьютера, поэтому ли фактические данные ограничены единичным интервалом, я не думаю, что это материал для описания самого графика.) Я бы не стал называть диаграмма рассеяния ранжированных данных под другим именем, потому что точки не размещены «там, где они принадлежат».
Энди Ш
20

Это называется сюжет ковра (см., Например, здесь или здесь ). В R это можно сделать с помощью rugфункции.

Сюжет, кажется, появляется также под другим именем, как полосовая диаграмма , на что он ссылается Филиппом I. Хороший в Введение в статистику с помощью методов передискретизации и R / S-Plus (2005, Wiley). В R это вызывается stripchartфункцией.

Кажется, что крошечная версия, которая часто сопровождает более крупный график, называется графиком коврика, в то время как автономный график, состоящий из точек или вертикальных линий, называется полосовой диаграммой.

Тим
источник
Черт, я был так близко - я искал тряпичный сюжет (и, как и следовало ожидать, ничего не придумал). Спасибо!
января
2
Я думаю, что на практике люди называют такие графики ковчегами только в том случае, если они находятся на некотором расстоянии от какой-либо другой точки, такой как гистограмма или точечная диаграмма.
Ник Кокс
3

В коммерческом маркировке товаров, штрих-кода или

если они представляют собой линии частоты, нанесенные на график времени, Spectrum .

EDIT1

Когда в электромагнитных облаках или газовых хроматографах силы построены линейно на частотной шкале, то мы также можем сказать « Спектр».

Narasimham
источник
3
Привет, добро пожаловать на сайт. К сожалению, это не отвечает на вопрос, поскольку линии в штрих-кодах или спектрах не «указывают распределение некоторых выборок в диапазоне», как указано в вопросе.
Юхо Коккала
4
@JuhoKokkala Я не согласен частично. Штрих-коды, используемые в промышленности, не совпадают, согласились, но термин «график штрих-кода» использовался для обозначения такого типа графика для реальных данных. Точно так же, спектроскопические данные, безусловно, тоже относятся к данным. Я бы не стал придерживаться формулировки ОП, так как она путает «выборки» и «выборочные значения».
Ник Кокс
2
Коврик сюжет самый близкий, согласен. Но это также называется штрих-кодом. Тем не менее, график штрих-кода часто имеет толщину линии или оттенок / прозрачность, чтобы показать плотность близко расположенных значений. Мы используем этот вид графика с данными ДНК, чтобы отметить места расположения объектов.
Дайан Кук
0

У меня та же проблема: как называется «штрих-код», как визуализация для истинных / ложных данных

Моя цель - представить список массивов истина / ложь, соответствующих массиву слов в фиксированном месте в массиве. Как представление «светового спектра», чтобы идентифицировать ассортимент конкретной световой волны .... в той же ситуации я хочу подчеркнуть недостающие слова и настоящие слова

Я нашел на Вега Стриптиз

https://vega.github.io/vega-lite/examples/tick_strip.html

Я думаю, что для моей цели лучше назвать мою идею визуализации

Доменико М.
источник