簡體   English   中英

PCA和Hotelling的T ^ 2用於R中的置信度

[英]PCA and Hotelling's T^2 for confidence intervall in R

我進行了主成分分析並獲得了2個第一主成分。 我根據2台電腦的得分制作了我的積分圖表。 我想在此圖上添加一個對應於Hotelling T ^ 2測試的95%置信區域,以便檢測橢圓外的點(異常值)R中的可能性如何? 你有什么例子嗎?

我會做這樣的事情並檢測橢圓中的點:

在此輸入圖像描述

我們可以用veganggbiplot繪制PCA的置信橢圓,如下所示:

set.seed(1)
data <- matrix(rnorm(500), ncol=5) # some random data
data <- setNames(as.data.frame(rbind(data, matrix(runif(25, 5, 10), ncol=5))), LETTERS[1:5]) # add some outliers
class <- sample(c(0,3,6,8), 105, replace=TRUE) # 4 groups

library(vegan)
PC <- rda(data, scale=TRUE)
pca_scores <- scores(PC, choices=c(1,2))
plot(pca_scores$sites[,1], pca_scores$sites[,2],
     pch=class, col=class, xlim=c(-2,2), ylim=c(-2,2))
arrows(0,0,pca_scores$species[,1],pca_scores$species[,2],lwd=1,length=0.2)
ordiellipse(PC,class,conf=0.95)

在此輸入圖像描述

library(ggbiplot)
PC <- prcomp(data, scale = TRUE)
ggbiplot(PC, obs.scale = 1, var.scale = 1, groups = as.factor(class), ellipse = TRUE, 
                                                    ellipse.prob = 0.95)

在此輸入圖像描述

pcaMethods包有一個函數 simpleEllipse(x, y, alpha, len)來執行此操作。 給定兩個不相關的數據向量,它將返回一個橢圓,其中軸根據每個得分的方差和F統計量進行縮放。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM