簡體 English 中英

當 n_components 為 None 時如何解釋 Scikit-learn 的 PCA？

[英]How to interpret Scikit-learn's PCA when n_components are None?

原文 2020-08-03 09:07:55 9 1 python/ scikit-learn/ pca/ dimensionality-reduction

我對標題中提到的問題感到困惑。 n_components=None是否意味着在輸入中沒有進行任何轉換，或者它已經轉換到新的維度空間，而不是通常的“減少”（保留少數具有高特征值的組件）並保留所有新的合成特征？ 文檔為我建議了前者：

因此， None 情況導致： n_components == min(n_samples, n_features) - 1

但這並不完全清楚，此外，如果它確實意味着保留所有組件，為什么這些組件的數量等於n_components == min(n_samples, n_features) - 1 ，為什么不n_features ？

但是，我找到了另一種選擇（如果沒有，則放棄整個 PCA 步驟），我從未聽說過在不省略一些特征向量的情況下應用 PCA ......

1 個解決方案

根據官方文檔 -

如果 svd_solver == 'arpack'，組件的數量必須嚴格小於 n_features 和 n_samples 的最小值。 因此， None 情況導致： n_components == min(n_samples, n_features) - 1

所以它取決於用於特征向量的求解器的類型（可以通過參數設置）。

如果 arpack：運行 SVD 截斷為 n_components，通過 scipy.sparse.linalg.svds 調用 ARPACK 求解器。 它嚴格要求 0 < n_components < min(X.shape)

至於您關於刪除整個 PCA 步驟的第二個查詢，這完全取決於您要解決的問題。 由於 PCA 組件按降序解釋數據的變化（第一個組件解釋最大方差，最后一個組件解釋最小方差），因此對於特定任務來說，具有一些解釋更多方差的特征可能很有用。

如何在Scikit-learn中使用`Dirichlet Process Gaussian Mixture Model`？（n_components？）

[英]How to use `Dirichlet Process Gaussian Mixture Model` in Scikit-learn? (n_components?)

如何使用PCA和scikit-learn進行標准化

[英]How to normalize with PCA and scikit-learn

無需使用“內部” API就可以在scikit-learn PCA上獲取組件

[英]Get the components on scikit-learn PCA without using “internal” API

如何正確刪除Scikit-Learn的DPGMM的冗余組件？

[英]How to properly remove redundant components for Scikit-Learn's DPGMM?

scikit-learn 中 PCA 的質量

[英]Quality of PCA in scikit-learn

我應該如何使用它的`.components`編寫代碼scikit-learn PCA`.transform（）`方法？

[英]How should I write the code scikit-learn PCA `.transform()` method by using its `.components`?

使用scikit-learn PCA.score（）時出錯

[英]Error when using scikit-learn PCA.score()

如何從scikit-learn運行和解釋Fisher的線性判別分析

[英]How to run and interpret Fisher's Linear Discriminant Analysis from scikit-learn

如何解釋scikit-learn中的roc_curve（測試，預測）

[英]How to Interpret roc_curve(Test,Predictions) in scikit-learn

如何解釋Scikit-學習混淆矩陣

[英]How can I interpret Scikit-learn confusion matrix

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何在Scikit-learn中使用`Dirichlet Process Gaussian Mixture Model`？（n_components？）如何使用PCA和scikit-learn進行標准化無需使用“內部” API就可以在scikit-learn PCA上獲取組件如何正確刪除Scikit-Learn的DPGMM的冗余組件？ scikit-learn 中 PCA 的質量我應該如何使用它的`.components`編寫代碼scikit-learn PCA`.transform（）`方法？使用scikit-learn PCA.score（）時出錯如何從scikit-learn運行和解釋Fisher的線性判別分析如何解釋scikit-learn中的roc_curve（測試，預測）如何解釋Scikit-學習混淆矩陣

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM