![](/img/trans.png)
[英]Calculate correlations between data.frame columns and assign output to list
[英]Calculate Correlations of Pairs of Columns in a Data Frame in R
我有以下數據框:
set.seed(1)
y <- data.frame(a1 = rnorm(5) , b1 = rnorm(5), c1 = rnorm(5), a2 = rnorm(5), b2 = rnorm(5), c2 = rnorm(5))
我想獲取列對的相關性:cor(a1,a2),cor(b1,b2),cor(c1,c2)
我嘗試了以下操作,但NA顯示為輸出:
apply(y,2,function(x) cor(x[1],x[3]))
我想得到的結果等於
cor(y[,1],y[,4])
cor(y[,2],y[,5])
cor(y[,3],y[,6])
在我的實際數據框中,我有更多對列。
有任何想法嗎?
謝謝你的支持。
num.vars <- length(y)
var1 <- head(names(y), num.vars / 2)
var2 <- tail(names(y), num.vars / 2)
mapply(cor, y[var1], y[var2])
# a1 b1 c1
# 0.2491625 -0.5313192 0.5594564
對名稱使用可變正則表達式的另一種方法。 如果變量名以任意順序,這也適用。
nn <-
unique(sub('([0-9]+)','',names(y )))
sapply(nn,function(x){
xy = y[,grep(x,names(y))]
cor(xy[,1],xy[,2])})
a b c
-0.7615458 0.5683647 0.5594564
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.