[英]How to do these in weka: cross validation + imbalanced data + feature selection
我有一个不平衡的数据集(分类数据集)。 预处理后:特征个数77个,实例个数1425个(多数类=1196(83.93%),少数类=229(16.07%))。
我想使用 Weka 平台应用这些技术:
我的问题是:
谢谢你。
我的目标是按照相同的顺序执行以下操作:
因此,我使用 Weka 执行了以下操作:
我的工作正确吗?
预处理面板或特征选择选项卡只能用于探索数据(因此得名Weka Explorer )。
为了合并预处理以解决平衡训练数据或选择属性的问题,请使用 Weka 的元分类器(您可以嵌套它们):
平衡是最外层的分类器,它使用特征选择分类器作为它的分类器。
您可以使用Weka Experimenter比较各种设置并获得统计显着性结果。 有关详细信息,请参阅 Weka 手册 PDF。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.