簡體   English   中英

與 R 中超過 2 個變量的自舉相關性

[英]Bootstrapped correlation with more than 2 variables in R

我正在嘗試計算 R 中六個變量之間的自舉相關性。 但是我發現的所有示例、解決方案和教程都是針對兩個變量的。 我適應了,但我不確定我是否得到了正確的 output。

假設這是我的數據:

dado <- tibble(var1 = rnorm(104, mean = 7, sd = 1.5), var2 = rnorm(104, mean = 2.88, sd = 1.12),
               var3 = rnorm(104, mean = 1.55, sd = 0.8), var4 = rnorm(104, mean = 3.52, sd = 1.2),
               var5 = rnorm(104, mean = 2.67, sd = 0.94), var6 = rnorm(104, mean = 2.33, sd = 1.45))

我嘗試使用以下代碼進行引導,但 output 不清楚。

foo.matriz <- function(data, indices, cor.type = "pearson"){
        dt<-data[indices,]
        cor(dt, method = cor.type)
}

boot_strap <- boot(data = dado, statistic = foo.matriz, R = 1000)

我應該將其解釋為:第一行等於第一個變量與其自身的相關性; 第二行是第一個變量與第二個變量的相關性; 等等? 當數字 1 再次出現時,循環又從第二個變量開始?

答案是肯定的。 但這可能無關緊要。 如果您在 6x6 相關矩陣中按行或按列 go,您將得到相同的結果,因為上下三角形是對稱的。

如果您不確定矩陣如何重塑為向量,請考慮以下問題:


m <- matrix( 1:36, nrow=6 )
print(m)

as.numeric( m )
## 1 2 3 4 5 6 7 etc... indicating that the default order is by column from left to right.

雖然我不能輕松地評論你方法的合理性,但結果是你所懷疑的。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM