繁体   English   中英

非结构化数据的文本分析

[英]Text analysis for unstructured data

我有一个问题,我确实有大量的非结构化文本数据,我想将其分类为不同的扇区。

我正在为此使用朴素贝叶斯分类器

现在,我的问题是我应该通过什么? 因为我没有目标值

并且根据语法我必须通过它。

mnb = MultinomialNB()

mnb.fit(X,y)

TypeError: fit() missing 1 required positional argument: 'y'

如我所说,我没有目标价值。

我怎样才能做到这一点?

帮助将不胜感激

朴素贝叶斯分类器是一种有监督的学习方法,它要求您使用预先知道目标的带标签数据进行训练。 然后,您可以将其用于未标记的数据以预测将来的值,但不能针对没有目标值的数据进行训练。

在不了解您的任务的情况下很难推荐一种不同的方法,但是听起来您想研究无监督的聚类算法。 k均值是一个相对简单的起点。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM