[英]Bootstrapped correlation with more than 2 variables in R
我正在嘗試計算 R 中六個變量之間的自舉相關性。 但是我發現的所有示例、解決方案和教程都是針對兩個變量的。 我適應了,但我不確定我是否得到了正確的 output。
假設這是我的數據:
dado <- tibble(var1 = rnorm(104, mean = 7, sd = 1.5), var2 = rnorm(104, mean = 2.88, sd = 1.12),
var3 = rnorm(104, mean = 1.55, sd = 0.8), var4 = rnorm(104, mean = 3.52, sd = 1.2),
var5 = rnorm(104, mean = 2.67, sd = 0.94), var6 = rnorm(104, mean = 2.33, sd = 1.45))
我嘗試使用以下代碼進行引導,但 output 不清楚。
foo.matriz <- function(data, indices, cor.type = "pearson"){
dt<-data[indices,]
cor(dt, method = cor.type)
}
boot_strap <- boot(data = dado, statistic = foo.matriz, R = 1000)
我應該將其解釋為:第一行等於第一個變量與其自身的相關性; 第二行是第一個變量與第二個變量的相關性; 等等? 當數字 1 再次出現時,循環又從第二個變量開始?
答案是肯定的。 但這可能無關緊要。 如果您在 6x6 相關矩陣中按行或按列 go,您將得到相同的結果,因為上下三角形是對稱的。
如果您不確定矩陣如何重塑為向量,請考慮以下問題:
m <- matrix( 1:36, nrow=6 )
print(m)
as.numeric( m )
## 1 2 3 4 5 6 7 etc... indicating that the default order is by column from left to right.
雖然我不能輕松地評論你方法的合理性,但結果是你所懷疑的。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.