有條件的計算帶有R部分2的列中的值數

Question

我有兩個向量：

x <- c(1,1,1,1,1, 2,2,2,3,3,  3,3,3,4,4,  5,5,5,5,5 )
y <- c(2,2,1,3,2, 1,4,2,2,NA, 3,3,3,4,NA, 1,4,4,2,NA)

在這里（用R來有條件地計算列中的值的數量）討論了以下問題：當X被組吐時，如何通過Y和X查找x中的值的平均值：

  if x<=2, group I
  if 2<x<=3, group II
  if 3<X<=5, group III

最好的解決方案由@ Mike.Gahan提供：

#Bring in data.table library
require(data.table)
data <- data.table(x,y)

#Summarize data
data[,list(x=mean(x,na.rm=T)),by=list(y,x.grp=cut(x,c(-Inf,2,3,5,Inf)))]  [order(y,x.grp)]

但是此解決方案不會在結果中放入帶有NA的行。

有人知道如何輸出結果中的所有行，包括帶有NA的行嗎？

現在的輸出是：

         y    x.grp    x
     1:  1 (-Inf,2] 1.500000
     2:  1    (3,5] 5.000000
     3:  2 (-Inf,2] 1.250000
     4:  2    (2,3] 3.000000
     5:  2    (3,5] 5.000000
     6:  3 (-Inf,2] 1.000000
     7:  3    (2,3] 3.000000
     8:  4 (-Inf,2] 2.000000
     9:  4    (3,5] 4.666667
    10: NA    (2,3] 3.000000
    11: NA    (3,5] 4.500000

其中X是每個組和Y的X中數字的平均值

Answer 1

答案是：

setkey(result, y, x.grp)
result[CJ(unique(y), unique(x.grp))]

感謝@eddi！

有條件的計算帶有R部分2的列中的值數

問題描述

1 個解決方案

解決方案1
0 已采納 2014-07-17 03:28:08

有條件的計算帶有R部分2的列中的值數

問題描述

1 個解決方案

解決方案1 0 已采納 2014-07-17 03:28:08

解決方案1
0 已采納 2014-07-17 03:28:08