簡體 English 中英

為什么 sklearn 和 numpy 不同意 PCA 的乘法分量？

[英]Why does sklearn and numpy disagree about multiplying component of PCA?

原文 2020-12-17 18:16:09 0 1 python/ numpy/ scikit-learn/ pca

from sklearn.datasets import make_blobs
from sklearn.decomposition import PCA

SEED = 123
X, y = make_blobs(n_samples=1000, n_features=5000, cluster_std=90., random_state=SEED)
pca = PCA(2)
pca.fit(X)
pca1, pca2 = pca.components_

pcaX = pca.transform(X)
pcaXnp = np.array([X @ pca1, X @ pca2]).T

如果您打印出 pcaX 和 pcaXnp，您會發現它們很相似，但彼此不一致。 為什么這些應該不同？ 似乎“.components_”應該返回sklearn將矩陣乘以的內容，是否有理由說明它只是乘法的近似值？

1 個解決方案

sklearn.decomposition 的 PCA 使用奇異值分解或 SVD 來獲取您的主成分。 這僅在列首先通過它們的方式居中時才有效。 如果您檢查源代碼，他們會在 SVD 之前進行居中：

def _fit_full(self, X, n_components):
[...]
        # Center data
        self.mean_ = np.mean(X, axis=0)
        X -= self.mean_

因此，要獲得 PCA 分數，您需要先將矩陣居中：

pcaX = pca.transform(X)
Xc = X - X.mean(axis=0)
pcaXnp = np.array([Xc @ pca1, Xc @ pca2]).T

pcaX[:3]
array([[-101.45177987,  212.45583745],
       [ 520.84541298,   87.32254399],
       [-273.26407231, -318.78493994]])

pcaXnp[:3]
array([[-101.45177987,  212.45583745],
       [ 520.84541298,   87.32254399],
       [-273.26407231, -318.78493994]])

不確定 sklearn 中的 PCA

[英]Not sure about PCA in sklearn

sklearn與numpy中的PCA不同

[英]PCA in sklearn vs numpy is different

python numpy和sklearn之間的PCA差異

[英]PCA difference between python numpy and sklearn

numpy 和 sklearn PCA 返回不同的協方差向量

[英]numpy and sklearn PCA return different covariance vector

為什么在 numpy.sin 中將輸入乘以 pi 會導致它中斷？

[英]Why does multiplying input by pi in numpy.sin cause it to break?

為什么我的 PCA 和來自 sklearn 的 PCA 得到不同的結果？

[英]why my PCA and PCA from sklearn get different results?

Hows是否認為PCA適用於數據幀？

[英]Hows does sklearn PCA works on dataframes?

為什么sklearn.decomposition.PCA.fit_transform（X）不能與X相乘？

[英]Why does sklearn.decomposition.PCA.fit_transform(X) no multiplication by X?

為什么 sklearn 的訓練/測試拆分加上 PCA 會使我的標簽不正確？

[英]Why does sklearn's train/test split plus PCA make my labelling incorrect?

為什么numeric.js和numpy的SVD結果不一致？

[英]Why do SVD results from numeric.js and numpy disagree?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 不確定 sklearn 中的 PCA sklearn與numpy中的PCA不同 python numpy和sklearn之間的PCA差異 numpy 和 sklearn PCA 返回不同的協方差向量為什么在 numpy.sin 中將輸入乘以 pi 會導致它中斷？為什么我的 PCA 和來自 sklearn 的 PCA 得到不同的結果？ Hows是否認為PCA適用於數據幀？為什么sklearn.decomposition.PCA.fit_transform（X）不能與X相乘？為什么 sklearn 的訓練/測試拆分加上 PCA 會使我的標簽不正確？為什么numeric.js和numpy的SVD結果不一致？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM