根据另一列中的值对 R dataframe 中的列进行分组

Question

考虑以下一对列表

 ID<-c("A", "B")
 Var2<-c("T_X", "X_F", "R_X", "T_Y", "Y_F", "R_Y")

我创建了以下 dataframe

df2<-expand.grid(ID, Var2)

得到的 dataframe 如下

   Var1 Var2
1     A  T_X
2     B  T_X
3     A  X_F
4     B  X_F
5     A  R_X
6     B  R_X
7     A  T_Y
8     B  T_Y
9     A  Y_F
10    B  Y_F
11    A  R_Y
12    B  R_Y

我想按 Var1 列对 dataframe 重新排序，以便与 A 对应的所有值都在一起，并且与 B 一样。（注意这是一个玩具数据集，Var1 中唯一值的实际数量可能要高得多）。

以下是预期的output

   Var1 Var2
1     A  T_X
3     A  X_F
5     A  R_X
7     A  T_Y
9     A  Y_F
11    A  R_Y
2     B  T_X
4     B  X_F
6     B  R_X
8     B  T_Y
10    B  Y_F
12    B  R_Y

我试过 df2%>% group_by(Var1)。 这使 dataframe 保持不变。

我请求有人在这里帮助我。

Answer 1

我们可以反过来做。 之后无需任何order或任何包裹

setNames(expand.grid(Var2, ID)[2:1], c("Var1", "Var2"))

-输出

#    Var1 Var2
#1     A  T_X
#2     A  X_F
#3     A  R_X
#4     A  T_Y
#5     A  Y_F
#6     A  R_Y
#7     B  T_X
#8     B  X_F
#9     B  R_X
#10    B  T_Y
#11    B  Y_F
#12    B  R_Y

或者使用来自tidyr的crossing

library(tidyr)
crossing(ID, Var2 = factor(Var2, levels = Var2))

-输出

#   ID    Var2 
#   <chr> <chr>
# 1 A     T_X  
# 2 A     X_F  
# 3 A     R_X  
# 4 A     T_Y  
# 5 A     Y_F  
# 6 A     R_Y  
# 7 B     T_X  
# 8 B     X_F  
# 9 B     R_X  
# 10 B     T_Y  
# 11 B     Y_F  
# 12 B     R_Y

Answer 2

您可以使用tidyr的expand_grid ，它在此处按预期工作。

tidyr::expand_grid(ID, Var2)

#   ID    Var2 
#   <chr> <chr>
# 1 A     T_X  
# 2 A     X_F  
# 3 A     R_X  
# 4 A     T_Y  
# 5 A     Y_F  
# 6 A     R_Y  
# 7 B     T_X  
# 8 B     X_F  
# 9 B     R_X  
#10 B     T_Y  
#11 B     Y_F  
#12 B     R_Y

但是，您始终可以order df2 output 以获取所需格式的 output。

df2 <- expand.grid(ID, Var2)
df2[order(df2$Var1), ]

根据另一列中的值对 R dataframe 中的列进行分组

问题描述

2 个解决方案

解决方案1
2 2021-02-02 07:16:03

解决方案2
1 已采纳 2021-02-02 07:19:51

根据另一列中的值对 R dataframe 中的列进行分组

问题描述

2 个解决方案

解决方案1 2 2021-02-02 07:16:03

解决方案2 1 已采纳 2021-02-02 07:19:51

解决方案1
2 2021-02-02 07:16:03

解决方案2
1 已采纳 2021-02-02 07:19:51