繁体   English   中英

当分组重叠时,如何使用 ggplot2 创建箱线图?

[英]How do you use ggplot2 to create boxplots when the groupings overlap?

我有一组数据,其中有一个输出变量和一组标签。 我面临的问题是标签不是相互排斥的。 例如,假设我正在分析画作,我正在查看这幅画的价格和用于创作它的颜色。 我会有一个看起来像这样的数据集:

价格 使用的颜色
10 红、黑、蓝
12.5 红、绿、黄、黑、紫
11 蓝白色
15 红色的

我想使用 ggplot2 为所用颜色中包含“红色”的所有行创建一个价格箱线图,然后对“紫色”、“黑色”等执行相同的操作。但是我遇到的问题如果我简单地写,GGplot2 将这些标签中的每一个都视为唯一的

ggplot(aes(x=colors, y=price))+
geom_boxplot()

有谁知道一个好的解决方法吗?

您可以使用tidyr::separate_rows()来准备您的数据:

library(tidyr)
library(ggplot2)

your_data %>%
  separate_rows(Colors.Used) %>%
  ggplot() +
    geom_boxplot(aes(x = Colors.Used, y = Price))

结果:

与separate_rows() 的结果

使用的数据:

your_data <- tibble::tribble( ~Price, ~Colors.Used, 10, "Red, Black, Blue", 12.5, "Red, Green, Yellow, Black, purple", 11, "Blue, White", 15, "Red")

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM