[英]Computing multiple variance of a dataset in R
我的問題與這個問題有關。
我有如下數據
V1 V2
.. 1
.. 2
.. 1
.. 3
我需要針對V2
每個值累計計算V1
的數據方差(這意味着,對於V2
的特定值,請說n
,必須包括V1
對應的所有V2
小於n
所有行。
ddply
在這種情況下會ddply
幫助嗎?
我認為ddply
不會有所幫助,因為它建立在采用數據幀的非重疊子集的概念上。
d <- data.frame(V1=runif(1000),V2=sample(1:10,size=1000,replace=TRUE))
u <- sort(unique(d$V2))
ans <- sapply(u,function(x) {
with(d,var(V1[V2<=x]))
})
names(ans) <- u
我不知道是否有更有效的方法來做到這一點...
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.