如何在機器學習中處理具有不同維數的特征向量？

Question

我是機器學習的初學者，並且正在嘗試使用數據集來訓練對數線性分類器。 數據集包含五個要素，每個要素都是向量，但是要素的維數不同。 尺寸分別為3、1、6、2和2。 我嘗試使用PCA方法通過scikit-learn將尺寸減小為1，但效果不佳。 那么，如何處理這些特征以適合對數線性分類器模型（如邏輯回歸）？

Answer 1

一種簡單的方法就是將所有功能展平。 然后將其輸入到您的分類器中。

一個例子：

features = [... 
          [[0, 1 3], [5], [2, 6, 4, 7, 8, 9], [1, 0], [0, 1]], #for one sample
          ...]

使用列表推導將特征內的每個列表展平：

flattened_features = [[i for k in f for i in k] for f in features]

這將把功能變成這樣：

    flattened_features
    [... 
    [0,1,3,5,2,6,4,7,8,9,1,0,0,1], #for one sample
    ...]

現在，您可以將其轉換為numpy數組，並將其輸入模型中。

如何在機器學習中處理具有不同維數的特征向量？

問題描述

1 個解決方案

解決方案1
0 已采納 2018-04-13 03:09:32

如何在機器學習中處理具有不同維數的特征向量？

問題描述

1 個解決方案

解決方案1 0 已采納 2018-04-13 03:09:32

解決方案1
0 已采納 2018-04-13 03:09:32