[英]Customized merging of dataframe in R
我想合並以下數據框架,以便每一行包含數據點和數據點的列名。
non.MML X2.MML X3.MML X4.MML X5.MML X6.7.MML
-13.994 NA NA NA NA NA
NA -13.992 NA NA NA NA
NA NA -13.984 NA NA NA
NA NA NA -13.983 NA NA
NA NA NA NA -13.962 NA
NA NA NA NA NA NA -13.907
NA NA -1.2 NA NA NA
NA NA NA -14.2 NA NA
NA NA NA NA -11.01 NA
NA NA NA NA NA NA -17.23
這就是我想要得到的:
name score
non.MML -13.994
X2.MML -13.992
X3.MML -13.984
X4.MML -13.983
X5.MML -13.962
X6.7.MML -13.907
X3.MML -1.2
X4.MML -14.2
X5.MML -11.01
X6.7.MML -17.23
我嘗試使用它,它使我接近想要的東西:
mydata <- data.frame(x=unlist(mydata))
但是我得到這個:
x
non.MML1 -13.994
X2.MML1 -13.992
X3.MML1 -13.984
X4.MML1 -13.983
X5.MML1 -13.962
X6.7.MML1 -13.907
X3.MML2 -1.2
X4.MML2 -14.2
X5.MML2 -11.01
X6.7.MML2 -17.23
您會注意到,由於存在多個重復,因此每行的第一個元素都用數字進行了修改。 實現所需輸出的最佳方法是什么?
使用來自reshape2
melt
:
reshape2::melt(df, na.rm = TRUE, variable.name = "name", value.name = "score")
# name score
#1 non.MML -13.994
#12 X2.MML -13.992
#23 X3.MML -13.984
#27 X3.MML -1.200
#34 X4.MML -13.983
#38 X4.MML -14.200
#45 X5.MML -13.962
#49 X5.MML -11.010
#56 X6.7.MML -13.907
#60 X6.7.MML -17.230
或使用baseR stack
功能:
setNames(na.omit(stack(df)), c("score", "name"))
# score name
#1 -13.994 non.MML
#12 -13.992 X2.MML
#23 -13.984 X3.MML
#27 -1.200 X3.MML
#34 -13.983 X4.MML
#38 -14.200 X4.MML
#45 -13.962 X5.MML
#49 -11.010 X5.MML
#56 -13.907 X6.7.MML
#60 -17.230 X6.7.MML
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.