簡體   English   中英

如何在機器學習中處理具有不同維數的特征向量?

[英]How to process feature vectors with different dimension in machine learning?

我是機器學習的初學者,並且正在嘗試使用數據集來訓練對數線性分類器。 數據集包含五個要素,每個要素都是向量,但是要素的維數不同。 尺寸分別為3、1、6、2和2。 我嘗試使用PCA方法通過scikit-learn將尺寸減小為1,但效果不佳。 那么,如何處理這些特征以適合對數線性分類器模型(如邏輯回歸)?

一種簡單的方法就是將所有功能展平。 然后將其輸入到您的分類器中。

一個例子:

features = [... 
          [[0, 1 3], [5], [2, 6, 4, 7, 8, 9], [1, 0], [0, 1]], #for one sample
          ...]

使用列表推導將特征內的每個列表展平:

flattened_features = [[i for k in f for i in k] for f in features]

這將把功能變成這樣:

    flattened_features
    [... 
    [0,1,3,5,2,6,4,7,8,9,1,0,0,1], #for one sample
    ...]

現在,您可以將其轉換為numpy數組,並將其輸入模型中。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM