![](/img/trans.png)
[英]In R, how do I subset a data.frame by values from another data.frame?
[英]How do I get a data.frame from R's aggregate function in the right format?
我无法让R的aggregate()
函数以我想要的格式返回data.frame。
基本上我像这样运行聚合:
aggregate(df$res, list(full$depth), summary)
res
列包含TRUE
, FALSE
和NA
。 我想根据depth
组计算每个res
值的次数,这是六个数值深度值0,5,15,30,60和100.根据聚合函数的帮助页面,它强制通过价值因素,所以这不应该是一个问题(据我所知)。
所以我运行聚合函数并将其存储在data.frame中。 这可以; 它运行没有错误。 R控制台中显示的摘要如下所示:
Group.1 x.Mode x.FALSE x.TRUE x.NA's
1 0 logical 3 83 0
2 5 logical 3 83 0
3 15 logical 8 78 0
4 30 logical 5 79 2
5 60 logical 1 64 21
6 100 logical 1 24 61
再次,这很好,看起来像我想要的。 但是包含结果的data.frame实际上只有两列,如下所示:
Group.1 x
1 0 logical
2 5 logical
3 15 logical
4 30 logical
5 60 logical
6 100 logical
7 3
8 3
9 8
10 5
11 1
12 1
13 83
14 83
15 78
16 79
17 64
18 24
19 0
20 0
21 0
22 2
23 21
24 61
我从aggregate()
帮助页面了解到:
如果
by
具有名称,则非空时间用于标记结果中的列,未命名的分组变量by[[i]]
命名为Group.i
。
这表明,我认为,如果by
有名字,那么输出data.frame看起来更像是被印刷到R控制台(即,它就会有5列,包括计数的每个级别的列它总结by
)它实际上保存为两列版本。 问题是帮助页面根本没有解释变量命名by
内容,特别是如果它像我的情况那样被强制转换为data.frame列中的列表。
我需要做什么做的不同,以便从产生的data.frame aggregate()
有计数的每个级别的列by
作为帮助提示它可能如果我知道我在做什么?
这是因为在这种情况下aggregate
的结果相当奇怪,其中最后一列实际上是一个有四列的矩阵,因此结果看起来像一个5列数据帧,但它实际上是一个2列数据帧,其中第二列列是4宽矩阵。 以下是将其转换为普通 data.frame的解决方法:
X <- aggregate(sample(c(T, F, NA), 100, r=T), list(rep(letters[1:4], 25)), summary)
X <- cbind(X[-ncol(X)], X[[ncol(X)]])
str(X)
# 'data.frame': 4 obs. of 5 variables:
# $ Group.1: chr "a" "b" "c" "d"
# $ Mode : Factor w/ 1 level "logical": 1 1 1 1
# $ FALSE : Factor w/ 4 levels "10","4","6","8": 3 2 4 1
# $ TRUE : Factor w/ 2 levels "15","8": 2 1 2 2
# $ NA's : Factor w/ 4 levels "11","6","7","9": 1 2 4 3
结果的奇怪性是summary
返回4长度向量而不是单个值的函数。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.