特別決策樹

Question

我有下面的數據集，但它的值是字符串。 因此，當我要訓練決策樹時，應通過標簽編碼將這些功能轉換為num。 如何在可視化步驟和規則導出中在決策樹上打印這些字符串？

feature1  feature2  feature3  feature4  target
low       low       medium    high      sick
low       high      medium    medium    sick
high      medium    low       high      health
...

這是我創建決策樹的代碼：

le = preprocessing.LabelEncoder()
le.fit(data)
encoded_data = le.transform(data) 
tree.fit(encoded_data, target)

Answer 1

打印出類的映射：

list(le.classes_)

將標簽反向轉換為類別：

list(le.inverse_transform(list_of_labels))

文檔在這里。

您還可以使用pandas .factorize（）：

cat_list = ['a', 'b', 'c', 'd', 'd']
encoded_data, mapping_index = pd.Series(cat_list).factorize()

特別決策樹

問題描述

1 個解決方案

解決方案1
0 2018-10-15 06:47:34

特別決策樹

問題描述

1 個解決方案

解決方案1 0 2018-10-15 06:47:34

解決方案1
0 2018-10-15 06:47:34