[英]drawing multiple boxplots from imputed data in R
我正在分析一个估算的数据集,并且试图绘制箱形图,但是我无法围绕正确的过程进行研究。
我的数据(一个样本,原始的每个插补有20个观测值,每组有13个变量,所有值的范围是0到25):
.imp .id FTE_RM FTE_PD OMZ_RM OMZ_PD
1 1 25 25 24 24
1 2 4 0 2 6
1 3 11 5 3 2
1 4 12 3 3 3
2 1 20 15 15 15
2 2 4 1 2 3
2 3 0 0 0 6
2 4 20 0 0 0
.imp
表示估算回合, .id
表示每个观测值的标识符。
我想在一个绘图中绘制所有FTE_*
变量(在另一个绘图中绘制“ OMZ_ *”),但是想知道如何处理所有插值,是否可以仅包括所有值? 估算数据现在有500个观测值。 例如,使用方差分析,我需要将方差分析结果平均5,才能返回到20个观测值。 但这也需要箱线图,因为我只处理中位数,均值,最大值。 和分钟?
如:
data_melt <- melt(df[grep("^FTE_", colnames(df))])
ggplot(data_melt, aes(x=variable, y=value))+geom_boxplot()
我在ggplot上玩了几次,但认为自己是一个新手。
我假设您想在融化后保留.imp和.id的标识符,因此放置:
data_melt <- melt(df,c(".imp",".id"))
为了保证数据帧的完整性,可能需要引入标识类型的列-FTE与OMZ:
data_melt$type <- ifelse(grepl("FTE",data_melt$variable),"FTE","OMZ")
例如,有了此data.frame,您就可以在类型上刻面(或者,您可以在data_melt
上使用简单的filter语句将其限制为一种类型):
ggplot(data_melt, aes(x=variable, y=value))+geom_boxplot()+facet_wrap(~type,scales="free_x")
看起来像这样。 编辑:修复了数据混乱
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.