Я хотел бы показать значения данных на гистограмме с накоплением в ggplot2. Вот мой код попытки
Year <- c(rep(c("2006-07", "2007-08", "2008-09", "2009-10"), each = 4))
Category <- c(rep(c("A", "B", "C", "D"), times = 4))
Frequency <- c(168, 259, 226, 340, 216, 431, 319, 368, 423, 645, 234, 685, 166, 467, 274, 251)
Data <- data.frame(Year, Category, Frequency)
library(ggplot2)
p <- qplot(Year, Frequency, data = Data, geom = "bar", fill = Category, theme_set(theme_bw()))
p + geom_text(aes(label = Frequency), size = 3, hjust = 0.5, vjust = 3, position = "stack")
Я хотел бы показать эти значения данных в середине каждой части. Любая помощь в этом отношении будет принята с благодарностью. Спасибо
Ответы:
ggplot 2.2.0
Наклейки From можно легко складывать, используяposition = position_stack(vjust = 0.5)
вgeom_text
.Также отметим , что «
position_stack()
и вposition_fill()
настоящее время стек значений в обратном порядке группировки, которая делает заказ стека по умолчанию совпадает с легендой.»Ответ действителен для более старых версий
ggplot
:Вот один из подходов, который вычисляет средние точки столбцов.
источник
data.table
вместоplyr
, так что что-то вроде этого:Data.dt[,list(Category, Frequency, pos=cumsum(Frequency)-0.5*Frequency), by=Year]
Как упоминал Хэдли, существуют более эффективные способы передачи вашего сообщения, чем ярлыки на гистограммах с накоплением. Фактически, составные диаграммы не очень эффективны, поскольку столбцы (каждая категория) не имеют общей оси, поэтому сравнение затруднено.
В таких случаях почти всегда лучше использовать два графика с общей осью. В вашем примере я предполагаю, что вы хотите показать общую сумму, а затем пропорции, внесенные каждой категорией за данный год.
Это даст вам двухпанельный дисплей, подобный этому:
Если вы хотите добавить значения частоты, таблица - лучший формат.
источник