繁体 English 中英

建议使用近 20 万个标签的文本分类模型

[英]Recommendations for text classification models to work with almost 200K labels

原文 2019-06-26 10:04:06 4 1 python/ machine-learning/ scikit-learn/ nlp

所以基本上我想对很多标签进行分类（200K+）。 是否有任何推荐的模型我应该尝试以获得相对较好的准确性而不需要几天才能完成？

我曾尝试将 Sklearn 的 OneVsRestClassifier 用于 LinearRegression，但我将其放置了一夜，但拟合仍未完成

我相信应该有更高效的 NLP 多类分类算法

提前致谢

1 个解决方案

给定您可用的数据量，请考虑多项式朴素贝叶斯。 Sklearn 有一个非常直接的实现： https ://scikit-learn.org/stable/modules/generated/sklearn.naive_bayes.MultinomialNB.html 这将比使用神经网络更快。 与数据较少的较大模型相比，简单模型上的大量训练数据总是具有更强的预测能力。

从scrapy提取20万个域中的文本

[英]Extract text from 200k domains with scrapy

Python：将200k JSON文件读入Pandas Dataframe

[英]Python: Reading 200k JSON files into a Pandas Dataframe

用于比较200k字符串的数据结构

[英]Data structure for comparing 200k strings each other

创建具有 200k 唯一值的虚拟变量

[英]Creating Dummy Variable with 200k unique value

将45百万行文本文件与大约200k行文本文件进行比较并从较小文件生成非匹配的最有效方法是什么？

[英]What is the most efficient way to compare 45 Million rows of Text File to about 200k rows text file and produce non matches from the smaller file?

pymongo需要24小时才能完成200K记录

[英]pymongo taking over 24 hours to loop through 200K records

针对 Pandas DataFrame 上的 200K 行迭代优化 Python 脚本

[英]Optimizing Python script for 200K row iteration over pandas DataFrame

Python 程序在尝试读取只有 200k 行数据的 CSV 文件时冻结我的计算机

[英]Python program freezes my computer when try to read CSV files with only 200k rows data

在200k行MySQL数据库上计算成对比较的最快方法

[英]Fastest way to calculate pairwise comparison on 200k row MySQL database

Tensorflow：预测 4 个标签中的 1 个用于文本分类

[英]Tensorflow: Predict 1 of 4 labels for text classification

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 从scrapy提取20万个域中的文本 Python：将200k JSON文件读入Pandas Dataframe 用于比较200k字符串的数据结构创建具有 200k 唯一值的虚拟变量将45百万行文本文件与大约200k行文本文件进行比较并从较小文件生成非匹配的最有效方法是什么？ pymongo需要24小时才能完成200K记录针对 Pandas DataFrame 上的 200K 行迭代优化 Python 脚本 Python 程序在尝试读取只有 200k 行数据的 CSV 文件时冻结我的计算机在200k行MySQL数据库上计算成对比较的最快方法 Tensorflow：预测 4 个标签中的 1 个用于文本分类

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM