汇总r中的几个变量

Question

我有一个长格式的相当大的数据集，由于两个不同的变量A和BEg，我需要计算ID的实例数。由于A或B，同一个人可以在多行中表示。我需要要做的是计算不太难的ID实例的数量，还要计算由于A和B导致的ID的数量，并将它们作为变量返回到数据集中。

问候，

// Mi

Answer 1

所述ddply()从封装功能plyr允许通过标识符变量打散数据，对每个块执行的功能，并且然后装配它全部回到一起。 因此，您需要按标识符和A / B状态将数据分开，计算每种组合发生的次数（使用nrow() ），然后将这些计数很好地重新组合在一起。

使用wkmor1的df ：

library(plyr)

x <- ddply(.data = df, .var = c("ID", "GRP"), .fun = nrow)

返回：

  ID GRP V1
1  1   a  2
2  1   b  2
3  2   a  2
4  2   b  2

然后将其合并回原始数据：

merge(x, df, by = c("ID", "GRP"))

Answer 2

好吧，根据我的理解，最快，最简单的解决方案是...

df$IDCount <- ave(df$ID, df$group, FUN = length)

Answer 3

这是一种使用“表格”对符合条件的行进行计数，并使用“合并”将频率添加回数据帧的方法。

> df<-data.frame(ID=rep(c(1,2),4),GRP=rep(c("a","a","b","b"),2))
> id.frq <- as.data.frame(table(df$ID))
> colnames(id.frq) <- c('ID','ID.FREQ')
> df <- merge(df,id.frq)
> grp.frq <- as.data.frame(table(df$ID,df$GRP))
> colnames(grp.frq) <- c('ID','GRP','GRP.FREQ')
> df <- merge(df,grp.frq)
> df
  ID GRP ID.FREQ GRP.FREQ
1  1   a       4        2
2  1   a       4        2
3  1   b       4        2
4  1   b       4        2
5  2   a       4        2
6  2   a       4        2
7  2   b       4        2
8  2   b       4        2

汇总r中的几个变量

问题描述

3 个解决方案

解决方案1
3 2010-05-11 22:44:09

解决方案2
3 2010-05-11 22:48:31

解决方案3
0 2010-05-11 22:37:45

汇总r中的几个变量

问题描述

3 个解决方案

解决方案1 3 2010-05-11 22:44:09

解决方案2 3 2010-05-11 22:48:31

解决方案3 0 2010-05-11 22:37:45

解决方案1
3 2010-05-11 22:44:09

解决方案2
3 2010-05-11 22:48:31

解决方案3
0 2010-05-11 22:37:45