将列表列分隔为R中的列

Question

给定具有2列， id和value的数据帧，我想将其转换为具有更多列的数据帧，其中列包含id和列value的分位数： q0 ， q25 ， q50 ， q75 ， q100 。

我不知道如何将包含列表的列分成更多包含其值的列。 当然，所有列表都具有相同的长度。

这是一个例子：

library(dplyr)
library(tidyr)

set.seed(0)
df <- data.frame(id = rep(c("Alice", "Bob"), each = 10),
                 value = round(rnorm(20) * 10))
> df

id value
1  Alice    13
2  Alice    -3
3  Alice    13
4  Alice    13
5  Alice     4
6  Alice   -15
7  Alice    -9
8  Alice    -3
9  Alice     0
10 Alice    24
11   Bob     8
12   Bob    -8
13   Bob   -11
14   Bob    -3
15   Bob    -3
16   Bob    -4
17   Bob     3
18   Bob    -9
19   Bob     4
20   Bob   -12

df_quantiles <- df %>% 
  group_by(id) %>% 
  summarise( quantiles = list(quantile(value))) %>% 
  ungroup()
> df_quantiles

# A tibble: 2 x 2
          id quantiles
          
    1  Alice 
    2    Bob

> df_quantiles$quantiles

[[1]]
  0%  25%  50%  75% 100% 
 -15   -3    2   13   24 

[[2]]
    0%    25%    50%    75%   100% 
-12.00  -8.75  -3.50   1.50   8.00

下一个命令不起作用。 好的separate电话可以帮助我吗？ 有没有其他方法来获得结果？

> df_quantiles %>%
+ separate(quantiles, paste0("q", seq(0,5)))
# A tibble: 2 x 7
      id    q0    q1    q2    q3    q4    q5
*       
1  Alice     c    15     3     2    13    24
2    Bob     c    12     8    75     3     5
Warning message:
Too many values at 2 locations: 1, 2

我期望的是这个数据帧：

    id      q0%    q25%    q50%    q75%   q100%
1  Alice    -15      -3       2      13      24
2    Bob -12.00   -8.75   -3.50    1.50    8.00

Answer 1

怎么样

cbind.data.frame(id=unique(df$id), do.call(rbind, df_quantiles$quantiles))

与输出

id  0%   25%  50%  75% 100%
1 Alice -15 -3.00  2.0 13.0   24
2   Bob -12 -8.75 -3.5  1.5    8

Answer 2

我们可以使用data.table

library(data.table)
setDT(df)[, as.list(quantile(value)) , by =  id]
#      id  0%   25%  50%  75% 100%
#1: Alice -15 -3.00  2.0 13.0   24
#2:   Bob -12 -8.75 -3.5  1.5    8

或者使用dplyr

library(dplyr)
df %>%
   group_by(id) %>% 
   do(data.frame(as.list(quantile(.$value))))
#     id   X0.  X25.  X50.  X75. X100.
#  <fctr> <dbl> <dbl> <dbl> <dbl> <dbl>
#1  Alice   -15 -3.00   2.0  13.0    24
#2    Bob   -12 -8.75  -3.5   1.5     8

Answer 3

如果你需要dplyr解决方案，你可以使用它：

library(dplyr)
df %>% 
  group_by(id) %>%
  do(data.frame(t(quantile(.$value))))

#     id   X0.  X25.  X50.  X75. X100.
#   <fctr> <dbl> <dbl> <dbl> <dbl> <dbl>
#1  Alice   -15 -3.00   2.0  13.0    24
#2    Bob   -12 -8.75  -3.5   1.5     8

Answer 4

列表的组合，来自tibble的as_tibble，as.list和来自tidyr的不需要的工作

library(tidyverse)
df_quantiles <- df %>% 
  group_by(id) %>% 
  summarise(quantiles = list(as_tibble(as.list(quantile(value))))) %>% unnest() %>%
  ungroup()

将列表列分隔为R中的列

问题描述

4 个解决方案

解决方案1
5 2016-09-12 11:25:08

解决方案2
2 2016-09-12 11:17:46

解决方案3
2 已采纳 2016-09-12 11:19:07

解决方案4
2 2016-10-06 17:01:15

将列表列分隔为R中的列

问题描述

4 个解决方案

解决方案1 5 2016-09-12 11:25:08

解决方案2 2 2016-09-12 11:17:46

解决方案3 2 已采纳 2016-09-12 11:19:07

解决方案4 2 2016-10-06 17:01:15

解决方案1
5 2016-09-12 11:25:08

解决方案2
2 2016-09-12 11:17:46

解决方案3
2 已采纳 2016-09-12 11:19:07

解决方案4
2 2016-10-06 17:01:15