繁体   English   中英

如何在箱线图上打印频率-ggplot-R

[英]How to print frequency on boxplot - ggplot - R

这是我的数据框

X color   cut      carrat
1   E    Ideal     0.23
2   J    Premiun   0.34
3   E    Ideal     0.23
...

我想创建我的列var“ cut”的箱形图。

这是我想做的代码...

ggplot(diamonds, aes(cut)) + geom_boxplot()

但是,它无法正常运行,因为它要求缺少美学变量“ y”。

这是因为我没有向es提供第二个变种,我必须提供的第二个变种是什么? 因为我只需要x边缘的var“ cut”可以取的不同值,而Y边缘的频率就可以。

谢谢。

下面的代码将完成这项工作:

library(ggplot2)
p <- ggplot(diamonds, aes(x = cut, y=carat))
p <- p + geom_boxplot(outlier.colour = "blue", fill="grey85")
p <- p + labs(title = "Diamonds carats")
show(p)

箱线图是一些数据分布的分组,因此,您必须提供要对其箱分布进行分布的数据。 x美学必须代表类型, y必须代表数据集。

在此处输入图片说明

箱线图需要ay变量,因为它在说明分布。 剪切的行数不是分布,而是每个剪切只有一个。 以下是每次切割的次数:

> table(diamonds$cut)

     Fair      Good Very Good   Premium     Ideal 
     1610      4906     12082     13791     21551

该信息无法在箱形图中显示。 相反,您可以使用如下所示的条形图:

ggplot(diamonds, aes(x = cut)) +
  geom_bar()

产生此图的图表:

条形图

或者下面是切割和克拉的箱形图的代码,例如:

ggplot(diamonds, aes(x = cut, y = carat)) +
  geom_boxplot()

和图表:

箱形图

因此,箱图显示了按切割级别划分的克拉列的均值,范围和四分位数。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM