與 R 中超過 2 個變量的自舉相關性

Question

我正在嘗試計算 R 中六個變量之間的自舉相關性。 但是我發現的所有示例、解決方案和教程都是針對兩個變量的。 我適應了，但我不確定我是否得到了正確的 output。

假設這是我的數據：

dado <- tibble(var1 = rnorm(104, mean = 7, sd = 1.5), var2 = rnorm(104, mean = 2.88, sd = 1.12),
               var3 = rnorm(104, mean = 1.55, sd = 0.8), var4 = rnorm(104, mean = 3.52, sd = 1.2),
               var5 = rnorm(104, mean = 2.67, sd = 0.94), var6 = rnorm(104, mean = 2.33, sd = 1.45))

我嘗試使用以下代碼進行引導，但 output 不清楚。

foo.matriz <- function(data, indices, cor.type = "pearson"){
        dt<-data[indices,]
        cor(dt, method = cor.type)
}

boot_strap <- boot(data = dado, statistic = foo.matriz, R = 1000)

我應該將其解釋為：第一行等於第一個變量與其自身的相關性； 第二行是第一個變量與第二個變量的相關性； 等等？ 當數字 1 再次出現時，循環又從第二個變量開始？

Answer 1

答案是肯定的。 但這可能無關緊要。 如果您在 6x6 相關矩陣中按行或按列 go，您將得到相同的結果，因為上下三角形是對稱的。

如果您不確定矩陣如何重塑為向量，請考慮以下問題：


m <- matrix( 1:36, nrow=6 )
print(m)

as.numeric( m )
## 1 2 3 4 5 6 7 etc... indicating that the default order is by column from left to right.

雖然我不能輕松地評論你方法的合理性，但結果是你所懷疑的。

與 R 中超過 2 個變量的自舉相關性

問題描述

1 個解決方案

解決方案1
1 已采納 2021-03-23 00:01:15

與 R 中超過 2 個變量的自舉相關性

問題描述

1 個解決方案

解決方案1 1 已采納 2021-03-23 00:01:15

解決方案1
1 已采納 2021-03-23 00:01:15