繁体   English   中英

再现ggplot2 geom_linerange()示例

[英]Reproducing a ggplot2 geom_linerange() example

我正在尝试制作一个最终看起来像这样的情节:

geom_linerange()示例

但是,我希望每行的端点代表每组数字的第25个百分点(在底部)和第75个百分点(在顶部)。 中间的点应为中间值。 我可以使用geom_boxplot()从这些数据绘制箱形图,但是我认为这样看起来会更好。 无论如何,我无法完成这项工作。 现在,我收到此错误消息:

Warning message:
In data.frame(x = c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,  :
  row names were found from a short variable and have been discarded

我的数据如下所示:

> str(outbtu)
'data.frame':   86400 obs. of  2 variables:
 $ bias: num  -0.248 -0.759 -0.471 -0.304 -0.358 ...
 $ cnd : int  1 1 1 1 1 1 1 1 1 1 ...
> outbtu[1:10,]
          bias cnd
1  -0.24756150   1
2  -0.75906264   1
3  -0.47142178   1
4  -0.30395184   1
5  -0.35756559   1
6   0.04072695   1
7  -0.45026249   1
8  -0.20509166   1
9  -0.24816174   1
10 -0.01581920   1

最终cnd到达27,但是27个cnd值中的每个值都有3200个观测值,因此您显然在这里看不到它。 我想要此图上的27条线段,分别对应于27个cnd值的bias变量的第cnd和75%。

这是我的代码:

p <- ggplot(outbtu,aes(factor(cnd),bias,
                   ymin=quantile(bias,.25),
                   ymax=quantile(bias,.75)))
p <- p + geom_linerange()
p + geom_pointrange()

老实说,我什至不知道自己是否接近,这就是我可以从ggplot帮助页面中找到的内容。 提前致谢!

set.seed(42)
DF <- data.frame(bias=rnorm(2700),cnd=1:27)
DF$cnd <- factor(DF$cnd)

library(ggplot2)
ggplot(DF,aes(x=cnd,y=bias,colour=cnd)) + 
  stat_summary(fun.data=function(x) {
    res <- quantile(x,probs=c(0.25,0.5,0.75))
    names(res)<-c("ymin","y","ymax")
    res})

或更短:

ggplot(DF,aes(x=cnd,y=bias,colour=cnd)) + 
  stat_summary(fun.data=median_hilow,conf.int=0.5)

您需要分别计算所有统计信息,然后绘制获得的中位数和分位数。 否则, ymin=quantile(bias,.25)返回的向量大于factor(cnd)大小。

这是一个例子

# Generate sample data
df <- data.frame(a=rnorm(100), b=sample(1:5, 100, replace=T))
# Calculate statistics for each group of b values
df2 <- t(sapply(unique(df$b), function(x) {
  s <- summary(df[df$b == x, "a"])[c(2,3,5)]
  c(x, s)
}))
# Convert output matrix to data.frame since ggplot works only with data.frames
df2 <- as.data.frame(df2)
# Rename column names for clarity
colnames(df2) <- c("b", "Q1", "Median", "Q3")
# Draw obtained values
ggplot(df2, aes(x=b, y=Median, ymin=Q1, ymax=Q3)) + geom_pointrange()

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM