繁体   English   中英

NLTK中用于情感分析的词典

[英]dictionary for sentiment analysis in NLTK

我是python和NLTk的新手。 我创建了一个模型,用于NLTK(NaivesBayesCalssifier)中的调查情绪分析。 为了提高准确性,我想在模型中添加一些包含肯定和否定语句列表的字典。 NLTK中是否有任何模块,并且有任何其他功能可以改善我的模型吗?

您可以查看一些公共情感词典,这些词典可以为您提供正面和负面的语料库。

其中之一可以在https://www.cs.uic.edu/~liub/FBS/sentiment-analysis.html找到

由于您尚未指定有关当前模型的任何详细信息,因此我假设您使用的是非常基本的Naive Bayes分类器。 如果您现在使用unigram(单词)对文本进行矢量化处理,则可以考虑使用bigrams或trigrams生成特征向量,这基本上可以使您在一定程度上使用单词的上下文信息。

如果您当前使用的是Tfidf之类的单词模型将文本转换为转换,则可以考虑使用单词嵌入代替。 单词袋不考虑单词的上下文信息,而单词嵌入则可以利用这一点。

您可以使用gensim之类的东西,它使用深度学习将单词转换为向量。 看看: https : //radimrehurek.com/gensim/models/word2vec.html

此外,您始终可以尝试使用linearSVC分类器或逻辑回归分类器,然后选择能提供最高准确性的分类器。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM