繁体   English   中英

如何在文本分类中找到信息增益?

[英]How to find Information gain in text classification?

我正在使用决策树进行文本分类,该决策树使用信息增益作为文本文档分类的主要价值。 我已经通过TF * IDF值提取了一些功能。 但是我不知道应该如何准确计算信息增益? 有一些有关此的建议,但没有一篇文章非常清楚如何将其应用于文本文件。

您可以使用weka计算信息增益 在weka中, InfoGainAttributeEval.java类将针对文档针对单词计算IG。 检查此答案,这可能对您有帮助。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM