繁体   English   中英

使用带有颜色和线型的 geom_line 时如何避免之字形 plot

[英]How to avoid zig-zag plot when using geom_line with color and linetype

我有一个相对较大的数据集,可以在这里分享。

我正在尝试 plot 对应于 x = G 上 y 值的所有行(不仅仅是一个:例如平均值或中位数),数据按 I 和 P 分组; 因此变量 I 的水平以不同的颜色出现,而变量 P 的水平以不同的线型出现。

我遇到的问题是我得到的图形是沿 x 轴的之字形折线图。 显然,目的是为每个数据组合设置一条线,避免曲折。 我读过这个问题可能与数据的分组方式有关。 我尝试了几种使用group进行数据分组的组合,但我无法解决问题。

我使用的代码如下:

#Selecting colours
colours<-brewer.pal(n = 11, name = "Spectral")[c(9,11,1)]    

#Creating plot
data %>%
      ggplot(aes(x = G, y = y, color = I, linetype=P)) +
      geom_line(aes(linetype=P,color=I),size=0.2)+
      scale_linetype_manual(values=c("solid", "dashed")) +
      scale_color_manual(values=colours) +
      scale_x_continuous(breaks = seq(0,100, by=25), limits=c(0,100)) +
      scale_y_continuous(breaks = seq(0,1, by=0.25), limits=c(0,1)) +
      labs(x = "Time", y = "Value") +
      theme_classic() 

正如他们在其他论坛中所建议的那样,我还尝试在ggplot(aes())中添加group=interaction(I, P) ,但未成功。

遵循@JonSpring 的观点:

dd2 <- (filter(dd,G %in% c(16,17))
    %>% group_by(P,I,G)
    %>% summarise(n=length(unique(y)))
)

表明对于G/I/P的每种组合,您有许多不同的y值:

# A tibble: 12 x 4
# Groups:   P, I [6]
   P             I         G     n
   <chr>         <chr> <dbl> <int>
 1 heterogeneity I005     16    34
 2 heterogeneity I005     17    37
 3 heterogeneity I010     16    34
... [etc.]

如果您愿意,解决此问题的一种方法是使用stat_summary()让 R 将每组中的y值折叠到它们的平均值:

(dd %>%
 ggplot(aes(x = G, y = y, color = I, linetype=P)) +
 stat_summary(fun=mean, geom="line",
              aes(linetype=P,color=I,group=interaction(I,P)),size=0.2) +
 scale_linetype_manual(values=c("solid", "dashed")) +
 scale_color_manual(values=colours) +
 labs(x = "Time", y = "Value") +
 theme_classic()
)

您也可以在调用ggplot之前使用group_by() + summarise()自己执行此操作。

每个 I/P 组合一行的时间序列

提供的数据集中没有足够的信息来识别各个行。 如果我们愿意假设给定 I/G/P 组中值的顺序是适当的索引变量,那么我们可以这样做:

## add index variable
dd3 <- dd %>% group_by(P,I,G) %>% mutate(index=seq(n()))
(dd3 %>%
 ggplot(aes(x = G, y = y, color = I, linetype=P)) +
 geom_line(aes(group=interaction(index,I,P)), size=0.2) +
 scale_linetype_manual(values=c("solid", "dashed")) +
 scale_color_manual(values=colours) +
 labs(x = "Time", y = "Value") +
 theme_classic()
)

具有 600 条不同曲线的时间序列

如果这不是您的想法,那么您需要提供更多信息...

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM