簡體   English   中英

xgboost分類變量的特征重要性

[英]xgboost feature importance of categorical variable

我正在使用XGBClassifier在python中進行訓練,並且我的訓練數據集中有一些分類變量。 最初,我計划在輸入數據之前將它們轉換成幾個虛擬變量,但是隨后將為每個虛擬對象(而不是原始分類對象)計算功能重要性。 由於我還需要按重要性對所有原始變量(包括數字+類別)進行排序,因此我想知道如何獲得原始變量的重要性? 它只是加起來嗎?

通過將各個類別的重要性匯總到其原始父類別中,您可能會獲得幫助。 但是,除非這些功能具有很高的基數,否則我要花2美分單獨報告它們。 我傾向於在報告模型性能/重要性度量方面更加明確。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM