[英]Special decision tree
我有下面的數據集,但它的值是字符串。 因此,當我要訓練決策樹時,應通過標簽編碼將這些功能轉換為num。 如何在可視化步驟和規則導出中在決策樹上打印這些字符串?
feature1 feature2 feature3 feature4 target
low low medium high sick
low high medium medium sick
high medium low high health
...
這是我創建決策樹的代碼:
le = preprocessing.LabelEncoder()
le.fit(data)
encoded_data = le.transform(data)
tree.fit(encoded_data, target)
打印出類的映射:
list(le.classes_)
將標簽反向轉換為類別:
list(le.inverse_transform(list_of_labels))
文檔在這里 。
您還可以使用pandas .factorize() :
cat_list = ['a', 'b', 'c', 'd', 'd']
encoded_data, mapping_index = pd.Series(cat_list).factorize()
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.