繁体   English   中英

根据另一列中的值对 R dataframe 中的列进行分组

[英]group columns in R dataframe based on values in another column

考虑以下一对列表

 ID<-c("A", "B")
 Var2<-c("T_X", "X_F", "R_X", "T_Y", "Y_F", "R_Y")

我创建了以下 dataframe

df2<-expand.grid(ID, Var2)

得到的 dataframe 如下

   Var1 Var2
1     A  T_X
2     B  T_X
3     A  X_F
4     B  X_F
5     A  R_X
6     B  R_X
7     A  T_Y
8     B  T_Y
9     A  Y_F
10    B  Y_F
11    A  R_Y
12    B  R_Y

我想按 Var1 列对 dataframe 重新排序,以便与 A 对应的所有值都在一起,并且与 B 一样。(注意这是一个玩具数据集,Var1 中唯一值的实际数量可能要高得多)。

以下是预期的output

   Var1 Var2
1     A  T_X
3     A  X_F
5     A  R_X
7     A  T_Y
9     A  Y_F
11    A  R_Y
2     B  T_X
4     B  X_F
6     B  R_X
8     B  T_Y
10    B  Y_F
12    B  R_Y

我试过 df2%>% group_by(Var1)。 这使 dataframe 保持不变。

我请求有人在这里帮助我。

我们可以反过来做。 之后无需任何order或任何包裹

setNames(expand.grid(Var2, ID)[2:1], c("Var1", "Var2"))

-输出

#    Var1 Var2
#1     A  T_X
#2     A  X_F
#3     A  R_X
#4     A  T_Y
#5     A  Y_F
#6     A  R_Y
#7     B  T_X
#8     B  X_F
#9     B  R_X
#10    B  T_Y
#11    B  Y_F
#12    B  R_Y

或者使用来自tidyrcrossing

library(tidyr)
crossing(ID, Var2 = factor(Var2, levels = Var2))

-输出

#   ID    Var2 
#   <chr> <chr>
# 1 A     T_X  
# 2 A     X_F  
# 3 A     R_X  
# 4 A     T_Y  
# 5 A     Y_F  
# 6 A     R_Y  
# 7 B     T_X  
# 8 B     X_F  
# 9 B     R_X  
# 10 B     T_Y  
# 11 B     Y_F  
# 12 B     R_Y  

您可以使用tidyrexpand_grid ,它在此处按预期工作。

tidyr::expand_grid(ID, Var2)

#   ID    Var2 
#   <chr> <chr>
# 1 A     T_X  
# 2 A     X_F  
# 3 A     R_X  
# 4 A     T_Y  
# 5 A     Y_F  
# 6 A     R_Y  
# 7 B     T_X  
# 8 B     X_F  
# 9 B     R_X  
#10 B     T_Y  
#11 B     Y_F  
#12 B     R_Y  

但是,您始终可以order df2 output 以获取所需格式的 output。

df2 <- expand.grid(ID, Var2)
df2[order(df2$Var1), ]

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM