簡體   English   中英

h2o categorical_encoding了解何時使用以及為什么

[英]h2o categorical_encoding understanding when to use and why

我正在嘗試了解優點/缺點,以及何時使用參數“ categorical_encoding”在h2o中提供給我的各種編碼選項。

如果人們可以就如何使用它指出一般的經驗法則,將很有幫助。

通常,我使用'Enum'值,因為我喜歡在查看功能重要性時如何將所有分類值組合在一起。 另一方面,我相信xgboost的默認值是'label-encoder',它按類別級別/值進行分類。

不幸的是,我真的不知道從哪里開始,也不清楚這些可用的其他值:

  • 一熱內部
  • 一個熱門顯式
  • sort_by_response
  • enum_limited
  • 枚舉-label-encoder

再說一次,我主要堅持枚舉,有時是標簽編碼器,但老實說,我不知道這些各種選擇的實際含義。 希望能從博學的人那里得到何時比別人更好的概括理解!

根據要求(謝謝!),該問題已重新發布至交叉驗證。 因此,可以在以下位置找到有關優缺點的答案: https : //stats.stackexchange.com/questions/376203/categorical-encoding-in-h2o-what-is-the-difference-between-the-options

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM