如何以正确的格式从R的聚合函数中获取data.frame？

Question

我无法让R的aggregate()函数以我想要的格式返回data.frame。

基本上我像这样运行聚合：

aggregate(df$res, list(full$depth), summary)

res列包含TRUE ， FALSE和NA 。 我想根据depth组计算每个res值的次数，这是六个数值深度值0,5,15,30,60和100.根据聚合函数的帮助页面，它强制通过价值因素，所以这不应该是一个问题（据我所知）。

所以我运行聚合函数并将其存储在data.frame中。 这可以; 它运行没有错误。 R控制台中显示的摘要如下所示：

  Group.1  x.Mode x.FALSE x.TRUE x.NA's
1       0 logical       3     83      0
2       5 logical       3     83      0
3      15 logical       8     78      0
4      30 logical       5     79      2
5      60 logical       1     64     21
6     100 logical       1     24     61

再次，这很好，看起来像我想要的。 但是包含结果的data.frame实际上只有两列，如下所示：

    Group.1 x
1   0   logical
2   5   logical
3   15  logical
4   30  logical
5   60  logical
6   100 logical
7       3
8       3
9       8
10      5
11      1
12      1
13      83
14      83
15      78
16      79
17      64
18      24
19      0
20      0
21      0
22      2
23      21
24      61

我从aggregate()帮助页面了解到：

如果by具有名称，则非空时间用于标记结果中的列，未命名的分组变量by[[i]]命名为Group.i 。

这表明，我认为，如果by有名字，那么输出data.frame看起来更像是被印刷到R控制台（即，它就会有5列，包括计数的每个级别的列它总结by ）它实际上保存为两列版本。 问题是帮助页面根本没有解释变量命名by内容，特别是如果它像我的情况那样被强制转换为data.frame列中的列表。

我需要做什么做的不同，以便从产生的data.frame aggregate()有计数的每个级别的列by作为帮助提示它可能如果我知道我在做什么？

Answer 1

这是因为在这种情况下aggregate的结果相当奇怪，其中最后一列实际上是一个有四列的矩阵，因此结果看起来像一个5列数据帧，但它实际上是一个2列数据帧，其中第二列列是4宽矩阵。 以下是将其转换为普通 data.frame的解决方法：

X <- aggregate(sample(c(T, F, NA), 100, r=T), list(rep(letters[1:4], 25)), summary)
X <- cbind(X[-ncol(X)], X[[ncol(X)]])
str(X)
# 'data.frame':  4 obs. of  5 variables:
# $ Group.1: chr  "a" "b" "c" "d"
# $ Mode   : Factor w/ 1 level "logical": 1 1 1 1
# $ FALSE  : Factor w/ 4 levels "10","4","6","8": 3 2 4 1
# $ TRUE   : Factor w/ 2 levels "15","8": 2 1 2 2
# $ NA's   : Factor w/ 4 levels "11","6","7","9": 1 2 4 3

结果的奇怪性是summary返回4长度向量而不是单个值的函数。

如何以正确的格式从R的聚合函数中获取data.frame？

问题描述

1 个解决方案

解决方案1
7 2014-02-14 00:56:53

如何以正确的格式从R的聚合函数中获取data.frame？

问题描述

1 个解决方案

解决方案1 7 2014-02-14 00:56:53

解决方案1
7 2014-02-14 00:56:53