繁体   English   中英

如何解释相关性 plot 中的多重共线性?

[英]How to interpret multicollinearity in a correlation plot?

我在 R 中为我的数据集创建了一个相关性 plot 但我不确定如何选择以下哪对变量表示多重共线性? 带有示例的解释将非常有帮助!

在此处输入图像描述

也许一种方法是通过 qgraph。 首先,我将从lavaan package 加载 Holzinger 数据,从correlation性 package 加载相关性 function,并使用以下库加载 qgraph function 和qgraph package:

library(correlation)
library(qgraph)
library(lavaan)

从 Holzinger 数据创建相关矩阵:

cor_holz <- HolzingerSwineford1939 %>% 
  correlation()

然后一起制作所有相关性的qgraph。 较粗的线表示相关性更强,绿色表示正,红色表示负。 例如,您可以在此图中看到 x4-x6 在粗绿色三角形中高度相关:

qgraph(cor_holz)

这使得:

在此处输入图像描述

您可以通过为相关值建立截止值(如果您想查明哪些具有最强相关性会很有用)、添加标题并更改维度来使它更有趣:

qgraph(cor_holz, # correlation 
       cut=.30, # cutoff value for correlations
       details = T, # shows details
       mar = c(6,10,6,10), # size of graph
       vsize = 8, # size of nodes
       title = "Q Graph of All Correlations") # title

在此处输入图像描述

一个更清晰的示例是同一 lavaan package 中的FacialBurns数据,它显示了更明显的多重共线性,并且在各个变量中缺乏多重共线性:

face_cor <- FacialBurns %>% 
  correlation()

qgraph(face_cor)

在此处输入图像描述

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM