与R ggplot2组合的条形图：躲避并堆叠

Question

我有一个数据表，该数据表已包含要在带有ggplot2程序包的条形图上绘制的几个值（已经有累积数据）。

数据帧“保留”中的数据具有（简化）形式：

period,amount,a1,a2,b1,b2,h1,h2,h3,h4
J,18.1,30,60,40,60,15,50,30,5
K,29,65,35,75,25,5,50,40,5
P,13.3,94,6,85,15,10,55,20,15
N,21.6,95,5,80,20,10,55,20,15

第一列（时间段）是地质时期。 它将在x轴上，并且我不需要对其进行任何额外的排序，因此我使用以下命令准备了适当的因子标签

reserves$period <- factor(reserves$period, levels = reserves$period)

列“数量”是要绘制为y轴的主要列（它是每个时期中碳氢化合物的百分比，但是也可以是绝对值，例如数百万吨或其他）。 因此，基本绘图由命令调用：

ggplot(reserves,aes(x=period,y=amount)) + geom_bar(stat="identity")

但这是问题。 我需要在同一条形图上绘制其他值，即a1-a2，b1-b2和h1-h4。 这些值是每个字母的百分比值（例如a1 = 60，然后a2 = 40；对于b1-b2相同；对于h1-h4也是如此，它们的总和为100。因此：我需要具有a1- a2为某种颜色，按比例将x的“数量”条划分为x（堆叠的条形图），那么对于值b1-b2，我需要相同的值；因此，对于每个周期，我们有两个相邻的列（分组的条形图），每一个接下来，我需要第三列，对于值h1-h4，也许还需要作为堆叠的barplot，但是要么作为第三列，要么作为第一列上方的交错barplot。

所以布局看起来像这样：

我了解到，我需要首先使用包reshape2来重塑数据，然后在geom_bar（）中使用选项position =“ dodge”或position =“ fill”，但这是它们的组合。 第三个小节（对于值h1-h4）似乎需要固定高度的“堆积百分比”表示。

是否有可以更直观地处理数据以进行绘制的软件包？ 可以说，我们只声明要绘制变量ai，bi，hi。

Answer 1

首先，您应该将数据从宽到长整形，然后将比例调整为原始值。 然后将您的旧列名称（现在为“字母”级别）分成字母和数字以进行标记。 如果您的真实数据的格式不是这样（a1 ... h4），也可以使用这种方法。

library(dplyr)
library(tidyr)
library(ggplot2)

reserves <- read.csv(text = "period,amount,a1,a2,b1,b2,h1,h2,h3,h4
J,18.1,30,60,40,60,15,50,30,5
K,29,65,35,75,25,5,50,40,5
P,13.3,94,6,85,15,10,55,20,15
N,21.6,95,5,80,20,10,55,20,15") 

reserves.tidied <- reserves %>% 
  gather(key = lett, value = prop, -period, -amount) %>% 
  mutate(rawvalue = prop * amount/100,
         lett1 = substr(lett, 1, 1),
         num = substr(lett, 2, 2)) 

reserves.tidied

  period amount lett prop rawvalue lett1 num 1 J 18.1 a1 30 5.430 a 1 2 K 29.0 a1 65 18.850 a 1 3 P 13.3 a1 94 12.502 a 1 4 N 21.6 a1 95 20.520 a 1 5 J 18.1 a2 60 10.860 a 2 6 K 29.0 a2 35 10.150 a 2 7 P 13.3 a2 6 0.798 a 2 8 N 21.6 a2 5 1.080 a 2 9 J 18.1 b1 40 7.240 b 1 10 K 29.0 b1 75 21.750 b 1 11 P 13.3 b1 85 11.305 b 1 12 N 21.6 b1 80 17.280 b 1 13 J 18.1 b2 60 10.860 b 2 14 K 29.0 b2 25 7.250 b 2 15 P 13.3 b2 15 1.995 b 2 16 N 21.6 b2 20 4.320 b 2 17 J 18.1 h1 15 2.715 h 1 18 K 29.0 h1 5 1.450 h 1 19 P 13.3 h1 10 1.330 h 1 20 N 21.6 h1 10 2.160 h 1 21 J 18.1 h2 50 9.050 h 2 22 K 29.0 h2 50 14.500 h 2 23 P 13.3 h2 55 7.315 h 2 24 N 21.6 h2 55 11.880 h 2 25 J 18.1 h3 30 5.430 h 3 26 K 29.0 h3 40 11.600 h 3 27 P 13.3 h3 20 2.660 h 3 28 N 21.6 h3 20 4.320 h 3 29 J 18.1 h4 5 0.905 h 4 30 K 29.0 h4 5 1.450 h 4 31 P 13.3 h4 15 1.995 h 4 32 N 21.6 h4 15 3.240 h 4

然后，要绘制整理后的数据，您需要使字母跨过x轴，而我们刚计算出的原始值在y轴上具有amount * proportion。 我们将geom_col从1堆叠到2或从1堆叠到4（ reverse=T参数将覆盖默认值，该默认值在堆栈底部将为2或4）。 alpha和fill让我们区分同一条形图中的组和条形之间。

然后， geom_text将每个堆叠的段名称，换行符和原始百分比标记在每个段的中心。 scale再次反转默认行为，使每个条形中的1最暗，2或4最亮。 然后你facet划过，使一个组的每个时期吧。

  ggplot(reserves.tidied, 
         aes(x = lett1, y = rawvalue, alpha = num, fill = lett1)) +
    geom_col(position = position_stack(reverse = T), colour = "black") +
    geom_text(position = position_stack(reverse = T, vjust = .5), 
              aes(label = paste0(lett, ":\n", prop, "%")), alpha = 1) +
    scale_alpha_discrete(range = c(1, .1)) +
    facet_grid(~period) +
    guides(fill = F, alpha = F)

重新排列它，使“ h”条与“ a”条和“ b”条不同，这有点复杂，您必须考虑要如何显示它，但这是完全可行的。

与R ggplot2组合的条形图：躲避并堆叠

问题描述

1 个解决方案

解决方案1
2 已采纳 2017-08-12 18:01:55

与R ggplot2组合的条形图：躲避并堆叠

问题描述

1 个解决方案

解决方案1 2 已采纳 2017-08-12 18:01:55

解决方案1
2 已采纳 2017-08-12 18:01:55