[英]how to stem large csv file using PorterStemmer in Python?
我最近正在使用python在nlp中进行项目。 我需要预处理一个csv文件,其中包含具有许多行和列的文本。 我可以只使用简单的句子。 而且无法一次阻止整个csv文件。 我怎样才能做到这一点?
您可能必须阅读整个CSV文件并阻止每个单元格。 Python csv
库将允许您读取CSV文件。 您可能需要使用csv.reader()
或csv.DictReader()
。 第一个允许您循环浏览CSV的行并分别阅读它们; 第二个将自动将CSV中的数据放入Python 字典中 。 任一种都是您的任务的不错选择。
读完CSV文件后,您将需要阻止已读入的单词。您可能需要使用nltk
库 (如果尚未安装的话)。 这是有关使用nltk
阻止的资源。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.