簡體   English   中英

如何解釋相關性 plot 中的多重共線性?

[英]How to interpret multicollinearity in a correlation plot?

我在 R 中為我的數據集創建了一個相關性 plot 但我不確定如何選擇以下哪對變量表示多重共線性? 帶有示例的解釋將非常有幫助!

在此處輸入圖像描述

也許一種方法是通過 qgraph。 首先,我將從lavaan package 加載 Holzinger 數據,從correlation性 package 加載相關性 function,並使用以下庫加載 qgraph function 和qgraph package:

library(correlation)
library(qgraph)
library(lavaan)

從 Holzinger 數據創建相關矩陣:

cor_holz <- HolzingerSwineford1939 %>% 
  correlation()

然后一起制作所有相關性的qgraph。 較粗的線表示相關性更強,綠色表示正,紅色表示負。 例如,您可以在此圖中看到 x4-x6 在粗綠色三角形中高度相關:

qgraph(cor_holz)

這使得:

在此處輸入圖像描述

您可以通過為相關值建立截止值(如果您想查明哪些具有最強相關性會很有用)、添加標題並更改維度來使它更有趣:

qgraph(cor_holz, # correlation 
       cut=.30, # cutoff value for correlations
       details = T, # shows details
       mar = c(6,10,6,10), # size of graph
       vsize = 8, # size of nodes
       title = "Q Graph of All Correlations") # title

在此處輸入圖像描述

一個更清晰的示例是同一 lavaan package 中的FacialBurns數據,它顯示了更明顯的多重共線性,並且在各個變量中缺乏多重共線性:

face_cor <- FacialBurns %>% 
  correlation()

qgraph(face_cor)

在此處輸入圖像描述

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM