[英]WEKA Decision Tree with String attributes
我的属性集为20,其中很少是字符串,例如美国各州的代码,订阅计划的名称等。 我们如何在WEKA中处理字符串属性以构建决策树?
我读过有关stringtowordvector转换器的文章,但每个这些属性的字符串本身只是一个单词。
您可能已经弄清楚了-您必须将这样的“字符串属性”(实际的字符串属性在WEKA中是其他声明)声明为名义属性,即,必须在大括号中声明它们在ARFF标头中可以具有的所有值。
只需在您的ARFF文件中按照以下架构声明属性:
@attribute <att_name> string
请注意,因为Strings
内部存储在字符串表中,并由该表中的地址表示。 因此,包含相同字符的两个字符串将具有相同的值。
资料来源(本书):数据挖掘:实用机器学习工具和技术第3版
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.