[英]Combining overlapping groups to include in violin plot/box plot in R
我正在使用iris数据集来处理以下代码。 我想绘制一个小提琴图,只包括setosa种类,并在子组数据上做一些复杂的重叠组合。
具体来说,在x轴上,我想首先将连续的Sepal.Length数据分成组:A组= Sepal.Length <4.7,B组= Sepal.Length 4.7-5,C组= Sepal.Length 5 - 5.2和D组= Sepal.Length> 5.2。
然后,我想在x轴上绘制四个小提琴/盒子,单个/重叠组:“B”,“A + C”,“D”,“A + C + D”。 y轴简直就是“Petal.Length”。
我还包括显示每个小提琴的样本大小(n)的代码。
我将不胜感激任何建议。 谢谢。
library(dplyr)
library(ggplot2)
library(ggpubr)
# Define order of violins on x-axis.
order <- c("B", "AC", "D", "ACD")
# Function to display sample size (n) for each violin.
give.n <- function(x){return(c(y = min(Petal.Length), label = length(x)))}
iris %>%
filter(Species == "setosa") %>%
mutate(sub_a = case_when( Sepal.Length < 4.7~"A",
Sepal.Length < 5~ "B",
Sepal.Length < 5.2~ "C",
TRUE~"D")) %>%
mutate(collapsed = c((ifelse(sub_a %in% c("A", "C"), "AC", sub_a)), (ifelse(sub_a %in% c("AC", "D"), "ACD", sub_a)))) %>%
ggviolin(iris[iris$Species == "setosa", ], x=collapsed, y=Petal.Length) + scale_x_discrete(limits=order) + stat_summary(fun.data = give.n, geom = "text")
编辑
请参阅下面的预期结果。 请注意,每个小提琴下方的数字都是准确的。 图像的其余部分只是预期结果的一个例子。
我无法看到如何将其作为单链实现,但这是一个使用cut
然后bind_rows
的强力解决方案
setosa <- iris %>% filter(Species == "setosa") %>%
mutate(group = cut(Sepal.Length, breaks = c(0, 4.7, 5, 5.2, Inf), labels = c("A", "B", "C", "D"), right = FALSE))
bind_rows(B = setosa %>% filter(group == "B"),
AC = setosa %>% filter(group %in% c("A", "C")),
D = setosa %>% filter(group == "D"),
ACD = setosa %>% filter(group %in% c("A", "C", "D")),
.id = "group2"
) %>%
mutate(group2 = factor(group2, levels = c("B", "AC", "D", "ACD"))) %>%
ggplot(aes(x = group2, y = Petal.Length)) +
geom_violin()
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.