繁体   English   中英

R的调查包中的Pearson相关系数

[英]Pearson correlation coefficient in R's survey package

很抱歉,如果这是非常明显的,但我看不出如何在调查包中的两个变量之间进行简单的Pearson关联。 我的数据有层次,所以它相当于在apistrat中为api00和api99找到r。

library(survey)
data(api)

dstrat <- svydesign(id=~1,strata=~stype, weights=~pw, data=apistrat, fpc=~fpc)

我敢肯定必须有一个简单的方法,使用svyvar或svyglm或其他东西,但我看不到它?

您可以使用svyvar估计方差 - 协方差矩阵,然后将其缩放到相关性:

library(survey)
data(api)

dstrat <- svydesign(id=~1,strata=~stype, weights=~pw, data=apistrat, fpc=~fpc)
v <- svyvar(~api00+api99, dstrat)

as.matrix(v)
cov2cor(as.matrix(v))

这适用于任何数量的相关性和任何设计。

library(survey)
data(api)
dstrat<-svydesign(id=~1,strata=~stype, weights=~pw, data=apistrat, fpc=~fpc)
summary(svyglm(api00~ell+meals+mobility, design=dstrat),correlation=T)

我一直在思考这个问题,我开始认为最好的方法可能就是首先扩展两个变量,大概是使用svymean和svyvar。

dstrat2 <- transform(dstrat, 
                     z_api99 = (api99 - svymean(~api99,    dstrat))/sqrt(svyvar(~api99, dstrat)), 
                     z_api00 = (api00 - svymean(~api00, dstrat))/sqrt(svyvar(~api00, dstrat))) 

svyglm(z_api99 ~ z_api00, dstrat2)$coefficients

这给出9.759047e-01,这与使用的结果相同:

library(weights)
wtd.cor(apistrat$api99, apistrat$api00, weight = apistrat$pw)

它的优点是它几乎可以用于任何调查设计类型。 如果有更多变量,它还提供了获得标准化β系数的方法。 对于原始问题,这并不是我的意思,但如果没有特定的选项,它可能是最好的方法。

如果其他人可以确认这是否有效,或者有更好的方法,那么我将非常感谢任何进一步的评论。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM