[英]drawing multiple boxplots from imputed data in R
我正在分析一個估算的數據集,並且試圖繪制箱形圖,但是我無法圍繞正確的過程進行研究。
我的數據(一個樣本,原始的每個插補有20個觀測值,每組有13個變量,所有值的范圍是0到25):
.imp .id FTE_RM FTE_PD OMZ_RM OMZ_PD
1 1 25 25 24 24
1 2 4 0 2 6
1 3 11 5 3 2
1 4 12 3 3 3
2 1 20 15 15 15
2 2 4 1 2 3
2 3 0 0 0 6
2 4 20 0 0 0
.imp
表示估算回合, .id
表示每個觀測值的標識符。
我想在一個繪圖中繪制所有FTE_*
變量(在另一個繪圖中繪制“ OMZ_ *”),但是想知道如何處理所有插值,是否可以僅包括所有值? 估算數據現在有500個觀測值。 例如,使用方差分析,我需要將方差分析結果平均5,才能返回到20個觀測值。 但這也需要箱線圖,因為我只處理中位數,均值,最大值。 和分鍾?
如:
data_melt <- melt(df[grep("^FTE_", colnames(df))])
ggplot(data_melt, aes(x=variable, y=value))+geom_boxplot()
我在ggplot上玩了幾次,但認為自己是一個新手。
我假設您想在融化后保留.imp和.id的標識符,因此放置:
data_melt <- melt(df,c(".imp",".id"))
為了保證數據幀的完整性,可能需要引入標識類型的列-FTE與OMZ:
data_melt$type <- ifelse(grepl("FTE",data_melt$variable),"FTE","OMZ")
例如,有了此data.frame,您就可以在類型上刻面(或者,您可以在data_melt
上使用簡單的filter語句將其限制為一種類型):
ggplot(data_melt, aes(x=variable, y=value))+geom_boxplot()+facet_wrap(~type,scales="free_x")
看起來像這樣。 編輯:修復了數據混亂
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.