简体   繁体   English

是否必须将分类数据转换为数值数据才能使用解释(Microsoft 包)?

[英]Is it obligatory converting categorical data to numerical data to use interpret (Microsoft package)?

我是开源 InterpretML Python 包的新手,我想知道是否有必要将分类数据转换为数字数据以便使用任何玻璃/黑匣子,谢谢!

For training EBMs (Explainable Boosting Machines), which are glassbox models, you do not need to convert categorical data to numeric.对于训练 EBM(可解释提升机),这是玻璃盒模型,您不需要将分类数据转换为数字。 EBM can accept Pandas dataframes containing a mixture of types (numeric and strings representing categoricals), and will handle conversions implicitly. EBM 可以接受包含混合类型(数字和表示分类的字符串)的 Pandas 数据帧,并将隐式处理转换。

For other methods in InterpretML, including blackbox methods, you will need to handle conversions yourself at this time (through a technique like One Hot Encoding ).对于 InterpretML 中的其他方法,包括黑盒方法,此时您需要自己处理转换(通过像One Hot Encoding这样的技术)。

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM