У меня есть небольшой набор данных 14 раз для выполнения задачи. Однако у меня возникают трудности с поиском подходящего графика для использования в графике данных. Если бы образец был больше, я бы использовал коробочную диаграмму или гистограмму, но я не уверен, что было бы целесообразно использовать в этом случае, когда выборка очень мала.
Обновление: времена 5,2,3,9,5,6,4,2,3,8,4,1,6,0,5,6,4,4,4,5,4,9,4,5,4,9,4,2
Ответы:
Я думаю, что основной принцип здесь заключается в том, что вы можете и должны показывать все индивидуальные ценности. Даже если деталь не является явно интересной или полезной, нет причин не показывать ее или обязывать читателя декодировать (скажем) гистограмму, в которой столбцы могут представлять только одно или два значения.
Я предлагаю здесь небольшой композит. Слева вверху - точечная или полосчатая диаграмма (по меньшей мере двадцать других имен были использованы для одной и той же идеи), представленные горизонтально, а в верхнем правом углу та же идея, представленная вертикально. Экземпляры с одинаковым значением сопоставляются с помощью суммирования.
Внизу представлен график квантильного прямоугольника, в смысле Парзена, в котором молчаливый горизонтальный масштаб представляет собой кумулятивную вероятность (положение графика в обычном жаргоне), а условный квадрат медианы и квартилей можно нарисовать так, чтобы (в принципе) половина значения находятся внутри поля, как всегда объявляется, и половина значений снаружи. Дополнительная горизонтальная линия здесь представляет среднее значение. Некоторые люди добавляют средства на графы в виде дополнительной точки или символа маркера; Я считаю, что это может конфликтовать с отображением самих данных, и я предпочитаю дополнительную строку. Если линия для медианы и линия для среднего значения совпадают, вам нужно подумать, что делать. Почти всегда среднее значение и медиана заметно различаются.
Возможно, это стандартное явление единиц измерения на графике, но я не вижу, какие они есть.
(Я намеренно выдвинул здесь еще одну точку, которая заключается в том, что графики могут быть очень маленькими, но все же информативными. На практике я бы не стал делать их такими маленькими.)
РЕДАКТИРОВАТЬ:
Перекрестные ссылки добавлены к графикам квантильных коробок в широком смысле в смысле Парзена (дополнительные ссылки на втором месте ниже; существуют другие варианты использования «диаграмм квантильных коробок»)
Как я могу измерить разницу между непараметрическими данными со многими нулями?
Как использовать коробочные диаграммы, чтобы найти точку, в которой значения с большей вероятностью могут прийти из разных условий?
Как визуализировать два независимых t-критерия?
Как мне узнать, какой эксперимент проходит лучше, используя U-критерий Манна-Уитни?
Shera, DM 1991. Некоторые виды использования квантильных графиков для улучшения представления данных. Вычислительная наука и статистика 23: 50-53.
Militký, J. и M. Meloun. 1993. Некоторые графические пособия для одномерного анализа поисковых данных. Analytica Chimica Acta 277: 215-221.
Meloun, M. and J. Militký. 1994. Компьютерная обработка данных в аналитической хемометрии. I. Исследовательский анализ одномерных данных. Chemical Papers 48: 151-157.
РЕДАКТИРОВАТЬ 2:
Суть этих тем состоит не только в том, чтобы ответить на неотложный вопрос, но и в том, чтобы затронуть похожие вопросы, которые могут заинтересовать других.
Некоторые другие графические дизайны в других ответах здесь показывают идентификаторы, помеченные агностически 1 ... 14 в отсутствие других деталей. Предположим, что эти и другие идентификаторы были полезны при интерпретации, простой способ показать их - точечная диаграмма Кливленда. Вот две из нескольких возможностей, в которых порядок идентификаторов соблюдается буквально (слева) и в котором значения сортируются (справа). При необходимости есть много места для более длинных этикеток.
Преимущество этого дизайна перед гистограммами состоит в том, что ось ответа или результата может начинаться со значения, отличного от нуля, если это кажется лучшим выбором.
Поворот диаграмм так, чтобы ось отклика была вертикальной, также можно легко представить.
источник
@ Ник Кокс уже привел несколько хороших примеров, два других варианта, которые я использую довольно часто, - это прямоугольник с наложенными точками или слегка дрожащий,
С кодом R
РЕДАКТИРОВАТЬ: Вы также можете использовать скрипку, если вы этого хотите
источник
Ваш вопрос напомнил мне технику, описанную в этом блоге . Речь идет о визуализации дискретных событий.
Основная хитрость в том, чтобы построить
the time before an event
хthe time after an event
.Это может быть случайно, но в верхней средней области нет данных. Так что есть какая-то видимая структура.
Быстрый и грязный
R
код.источник
text
принимает векторные аргументы -text(x, y, 1:12)
должно работать.Другая идея, так как вы используете время.
Участок ипподрома - барплот с полярными координатами - дает тот же эффект, что и секундомер:
В идеале метки наблюдения должны быть наложены на стержни или, по крайней мере, на другой конец. Прямо сейчас у зрителя есть дополнительное напряжение отслеживания того, какое наблюдение есть (вверх / вниз) при проведении каких-либо сравнений.
источник