繁体   English   中英

如何在Python中使用PorterStemmer阻止大型csv文件?

[英]how to stem large csv file using PorterStemmer in Python?

我最近正在使用python在nlp中进行项目。 我需要预处理一个csv文件,其中包含具有许多行和列的文本。 我可以只使用简单的句子。 而且无法一次阻止整个csv文件。 我怎样才能做到这一点?

您可能必须阅读整个CSV文件并阻止每个单元格。 Python csv将允许您读取CSV文件。 您可能需要使用csv.reader()csv.DictReader() 第一个允许您循环浏览CSV的行并分别阅读它们; 第二个将自动将CSV中的数据放入Python 字典中 任一种都是您的任务的不错选择。

读完CSV文件后,您将需要阻止已读入的单词。您可能需要使用nltk (如果尚未安装的话)。 是有关使用nltk阻止的资源。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM