[英]Calculating correlations between response and certain explanatory variables
我想創建一個單獨的列,讓我知道我的因變量與我感興趣的所有解釋變量的相關性(所有這些列和更多列存儲在data.frame d中)。 通過做cor(d)我可以得到所有的相關性並通過做cor(d $ Var1,d $ Var2)我可以得到一個數字,但我想弄清楚如何從返回的矩陣中只得到Var1列cor(d),我可以選擇我想要包含的解釋變量。
cor函數實際上也可以這樣做。 假設我們有:
d=data.frame(dependentVar = c(1,2,3),var1=c(-1,-2,-3),var2=c(9,0,5),junk=c(-2,-3,5))
然后這將做的伎倆:
cor(d[,"dependentVar"], d[,c("var1","var2")])
var1 var2
[1,] -1 -0.4435328
它的效率較低(我猜),但你也可以這樣做:
cor(d)["dependentVar", c("var1","var2")]
它計算完整的相關矩陣,然后拉出你想要的子集。
@DavidR是正確的,盡管R還支持X列和Y列之間的相關性:
cor(X, Y)
有關更多信息,請參閱?cor
。
M <- round(cor(College[,-1]),2)
library('corrplot') #package corrplot
如果我們想要圖像而不是直接數字,我們也可以使用circle,square,eclipse而不是數字
corrplot(M, method = "number") #plot matrix
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.