[英]Named List To/From Data.Frame
我正在寻找一种在以下格式列表之间来回切换的快速方法:
$`a`
[1] 1 2 3
$`b`
[1] 4 5 6
到/来自以下格式的 data.frame:
name x
1 a 1
2 a 2
3 a 3
4 b 4
5 b 5
6 b 6
(在这种情况下,并不真正关心列的名称是什么。)
这是上面使用的 R 格式的数据框:
df <- data.frame(name=c(rep("a",3),rep("b",3)), x=c(1:3,4:6))
同样,我正在寻找两个单独的操作:一个将上述 data.frame 转换为列表,另一个将其转换回 data.frame。
在基础 R 中使用stack
和unstack
:
x <- data.frame(a=1:3, b=4:6)
x
a b
1 1 4
2 2 5
3 3 6
使用stack
从宽到高,即将向量堆叠在一起。
y <- stack(x)
y
values ind
1 1 a
2 2 a
3 3 a
4 4 b
5 5 b
6 6 b
使用unstack
进行相反的操作。
unstack(y)
a b
1 1 4
2 2 5
3 3 6
如果您的数据结构比您描述的更复杂,则stack
和unstack
可能不再适用。 在这种情况下,你将不得不使用reshape
的基础R,或melt
和dcast
封装reshape2
。
也许是这样的:
X <- split(df$x, df$name)
data.frame(name = rep(names(X), sapply(X, length)),
x=do.call('c', X))
编辑:我决定将 Andrie 和我的解决方案组合成一个似乎正是 OP 要求的相当简单的解决方案。 话虽如此,我不太明白我会以这种方式处理数据而不是安德里如何处理数据的情况,因为数据帧无论如何都是等长向量的列表。
# Your data set
df <- data.frame(name=c(rep("a",3),rep("b",3)), x=c(1:3,4:6))
# converting it to list of vectors
X <- split(df[, 2], df[, 1])
# converting it to a dataframe
Y <- stack(X)[, 2:1]; names(Y) <- names(df)
# Take Y and feed it back to these lines to show it
# switches back and forth
(X <- split(Y[, 2], Y[, 1]))
Y <- stack(X)[, 2:1]; names(Y) <- names(df);Y
另一种选择是enframe
从tibble
library(tidyverse)
enframe(lst1) %>%
unnest
lst1 <- list(a=1:3, b=4:6)
我希望对@Tyler Rinker 的建议发表评论
X <- split(df$x, df$name)
可以更普遍地完成
X <- split(df, df$name)
@Tyler Rinker 的 split() 解释与 R 食谱相符
指定可以对向量进行分组,而实际上可以对整个数据帧进行分组。 我认为对数据框而不是向量进行分组将是更有价值的工具(实际上是什么让我看到了这篇文章)。
(df <- data.frame(name=c(rep("a",3),rep("b",3), rep("c",3)), x=c(1:3,4:6, 7:9)))
(X <- split(df, df$name))
哈。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.