繁体   English   中英

Weka J48分类测试实例和返回值

[英]Weka J48 Classification Test Instances and Return Value

我有一个对象实例,它是J48树分类器的训练集。 正在插入该对象。 但是现在我需要对新数据进行分类。 假设我在火车上有24个属性。 在查询集中表示实例的最常用方法是什么?

每个实例必须具有23个属性(除标签值外,与火车集模式相同)或

使用与训练集相同的架构,将最后一个属性定义为标签,并且当它运行分类器时,以某种方式忽略了标签(我不确定这一点)?

第二个疑问来自分类:

j48.classifyInstance()的返回值; 该值以双精度形式返回,并且根据API,它是测试集上的类的标识符。 但是,trainset.class.class_name_from_int的参数为int。 从classifyInstance返回的双精度数是否仅表示0、1,... numClasses-1,我只需要强制转换为int还是需要应用任何数学转换(例如ceil或floor)?

对于您的第一个问题:当您拥有标记的测试集时,我认为第二种方法更好,因为当测试实例也具有标签时,您也可以评估模型。 不需要省略标签,因为分类期间模型不会使用标签。

对于您的第二个问题, classifyInstance的双精度值classifyInstance为绝对足够:

String prediction = train.classAttribute().value((int)  classifier.classifyInstance(testInstance));

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM