如何將 tibble 中的向量分組並匯總為單個向量？

Question


tibble(x = rep(1:3, 2),
       y = list(1:5, 1:10, 10:20, 20:40, 1:50, 5:10)) -> df

df
#> # A tibble: 6 × 2
#>       x y         
#>   <int> <list>    
#> 1     1 <int [5]> 
#> 2     2 <int [10]>
#> 3     3 <int [11]>
#> 4     1 <int [21]>
#> 5     2 <int [50]>
#> 6     3 <int [6]>

我想 group_by 'x' 並將每個組的向量匯總為一個向量。 我嘗試使用 c()，但沒有幫助。

df %>% 
  group_by(x) %>% 
  summarise(z = c(y))
#> `summarise()` has grouped output by 'x'. You can override using the `.groups`
#> argument.
#> # A tibble: 6 × 2
#> # Groups:   x [3]
#>       x z         
#>   <int> <list>    
#> 1     1 <int [5]> 
#> 2     1 <int [21]>
#> 3     2 <int [10]>
#> 4     2 <int [50]>
#> 5     3 <int [11]>
#> 6     3 <int [6]>

我還想要一個組中的元素聯合或應用於這些類型的數據集的任何其他類似函數。

df %>% 
  group_by(x) %>% 
  summarise(z = union(y))
#> Error in `summarise()`:
#> ! Problem while computing `z = union(y)`.
#> ℹ The error occurred in group 1: x = 1.
#> Caused by error in `base::union()`:
#> ! argument "y" is missing, with no default

Answer 1

如果您希望數據保持嵌套，您可以這樣做

df %>% 
  group_by(x) %>% 
  summarise(z = list(unlist(y)))

c()函數不起作用，因為它不會取消嵌套列表。 例如，比較

c(list(1:3, 4:5))
unlist(list(1:3, 4:5))

c函數不返回單個向量。 但unlist可以。 這很重要，因為您的函數將在您使用summarize時收到匹配行值的列表。

另請注意，如果您離開list() ，則不再嵌套這些值

df %>% 
  group_by(x) %>% 
  summarise(z = unlist(y))
#        x     z
#    <int> <int>
#  1     1     1
#  2     1     2
#  3     1     3
#  4     1     4
#  5     1     5
#  6     1    20
#  7     1    21
#  ...

如何將 tibble 中的向量分組並匯總為單個向量？

問題描述

1 個解決方案

解決方案1
1 已采納 2022-07-06 14:42:58

如何將 tibble 中的向量分組並匯總為單個向量？

問題描述

1 個解決方案

解決方案1 1 已采納 2022-07-06 14:42:58

解決方案1
1 已采納 2022-07-06 14:42:58