繁体   English   中英

建议使用近 20 万个标签的文本分类模型

[英]Recommendations for text classification models to work with almost 200K labels

所以基本上我想对很多标签进行分类(200K+)。 是否有任何推荐的模型我应该尝试以获得相对较好的准确性而不需要几天才能完成?

我曾尝试将 Sklearn 的 OneVsRestClassifier 用于 LinearRegression,但我将其放置了一夜,但拟合仍未完成

我相信应该有更高效的 NLP 多类分类算法

提前致谢

给定您可用的数据量,请考虑多项式朴素贝叶斯。 Sklearn 有一个非常直接的实现: https ://scikit-learn.org/stable/modules/generated/sklearn.naive_bayes.MultinomialNB.html 这将比使用神经网络更快。 与数据较少的较大模型相比,简单模型上的大量训练数据总是具有更强的预测能力。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM