繁体 English 中英

Python是否提供任何用于文本关系的库？

[英]Does Python provide any libraries for textual relationship?

原文 2017-09-06 15:49:32 3 1 python/ python-2.7/ python-3.x/ text/ sentiment-analysis

我有一句话，让我们说“美国”和一份文本文件。 我想知道整个文件是否与“美国”有关。 在文档中，“美国”一词可能被提及过100或1000次，但是到今天结束时，文档可能在谈论中国。

我使用了Python中的情感分析库，但是只有当文档以肯定，否定或中性的方式提及该词时，这些库才会返回。

我还可以算出该单词被提及的次数，以及该单词与文档中每个单词之间的相似度，但是仍然不知道如何判断整个文档是否与所提到的单词有关。

python中是否有任何库可以执行此操作，或者是否有任何API？

1 个解决方案

对此没有真正好的完整解决方案库。 您可能需要使用NLTK之类的词干和分析（ http://www.nltk.org ）。 词干如下：“法拉利->跑车->汽车->运输”，这使您可以看到单词的“基本”概念。

然后，您可能需要进行某种TF / IDF分析，以确定确切的文档内容。 这将帮助您确定哪些单词很重要（ http://scikit-learn.org/stable/modules/generation/sklearn.feature_extraction.text.TfidfVectorizer.html ）。

关于TF / IDF的很好的教程可以在这里找到： http : //stevenloria.com/finding-important-words-in-a-document-using-tf-idf/

将文本句子中的任何整数转换为python中的字符串

[英]convert any integer in a textual sentence to string in python

Python：IndentationError：unindent 不匹配任何外部缩进级别：文本到数字

[英]Python: IndentationError: unindent does not match any outer indentation level: Textual to Numeric

PyChar不会自动完成，甚至看不到Python中的任何库

[英]PyChar does not autocomplete, even does not sees any libraries from Python

Python 3.5.1无法识别我的任何库（sklearn lxml或urllib）

[英]Python 3.5.1 does not recognise any of my libraries (sklearn lxml or urllib)

过滤 Python 中的文本数据

[英]Filtering textual data in Python

是否有用于生成Python源代码的库？

[英]Are there any libraries for generating Python source?

Python有没有类似Gson的库

[英]Is there any Gson similar libraries for Python

Python 是否提供 range() 作为生成器？

[英]Does Python provide range() as generator?

python 是否提供同步缓冲区？

[英]Does python provide a synchronized buffer?

是否有通用的Python库提供像Django信号这样的“信号”（事件）功能？

[英]Are there generic Python libraries that provide 'signals' (event) capability like Django signals?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 将文本句子中的任何整数转换为python中的字符串 Python：IndentationError：unindent 不匹配任何外部缩进级别：文本到数字 PyChar不会自动完成，甚至看不到Python中的任何库 Python 3.5.1无法识别我的任何库（sklearn lxml或urllib）过滤 Python 中的文本数据是否有用于生成Python源代码的库？ Python有没有类似Gson的库 Python 是否提供 range() 作为生成器？ python 是否提供同步缓冲区？是否有通用的Python库提供像Django信号这样的“信号”（事件）功能？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM