簡體   English   中英

如何計算data.table中加權平均值的偏差?

[英]How to calculate deviations from weighted mean in data.table?

我想計算data.table許多變量與(加權)均值的data.table

我們來看這個例子:

mydt <- data.table(
    id = c(1, 2, 2, 3, 3, 3),
    x = 1:6,
    y = 6:1,
    w = rep(1:2, 3)
)

mydt
   id x y w
1:  1 1 6 1
2:  2 2 5 2
3:  2 3 4 1
4:  3 4 3 2
5:  3 5 2 1
6:  3 6 1 2

我可以計算xy的加權平均值如下:

mydt[
    ,
    lapply(
        as.list(.SD)[c("x", "y")], 
        weighted.mean, w = w
    ),
    by = id
]

(因為這個 bug,我使用相對復雜的as.list(.SD)[...]構造而不是.SDcols 。)

我試圖首先為每一行創建方法,但沒有找到如何組合:=lapply()

只需稍微調整加權平均值計算:

mydt[
    ,
    lapply(
        .SD[, .(x, y)], 
        function(var) var - weighted.mean(var, w = w)
    ),
    by = id
]

   id       x       y
1:  1  0.0000  0.0000
2:  2 -0.3333  0.3333
3:  2  0.6667 -0.6667
4:  3 -1.0000  1.0000
5:  3  0.0000  0.0000
6:  3  1.0000 -1.0000

該解決方案由@DavidArenburg建議的符號簡化更新。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM