繁体   English   中英

具有字符串属性的WEKA决策树

[英]WEKA Decision Tree with String attributes

我的属性集为20,其中很少是字符串,例如美国各州的代码,订阅计划的名称等。 我们如何在WEKA中处理字符串属性以构建决策树?

我读过有关stringtowordvector转换器的文章,但每个这些属性的字符串本身只是一个单词。

您可能已经弄清楚了-您必须将这样的“字符串属性”(实际的字符串属性在WEKA中是其他声明)声明为名义属性,即,必须在大括号中声明它们在ARF​​F标头中可以具有的所有值。

只需在您的ARFF文件中按照以下架构声明属性:

@attribute <att_name> string

请注意,因为Strings内部存储在字符串表中,并由该表中的地址表示。 因此,包含相同字符的两个字符串将具有相同的值。

资料来源(本书):数据挖掘:实用机器学习工具和技术第3版

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM