[英]Multi-label classification with FastText
我想知道 FastText 是否能够处理多标签数据? 有人可以分享一个简单的例子和混淆矩阵(真实标签与预测标签)吗? 我已经看过 FastText 文档页面。
先感谢您
本节介绍多label分类: https://github.com/facebookresearch/fastText/blob/main/docs/supervised-tutorial.md#multi-label-classification
处理多个标签的一种便捷方法是为每个 label 使用独立的二进制分类器。这可以通过-loss one-vs-all或-loss ova来完成。
准备训练数据
这已在安装 fastText部分的末尾进行了描述
文本文件的每一行都包含一个标签列表,后面是相应的文档。 所有标签都以__label __前缀开头,这就是 fastText 识别 label 或单词的方式。
文档和提供标签文本的格式似乎只提到每个文本一个 label。
您可以尝试在训练数据中多次重复相同的文本,每次都使用适当的标签之一。 (你可能想重新打乱训练数据,这样重复的文本就不会直接并排出现。)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.