[英]create pos tagged corpus with NLTK
我想用 NLTK 构建 pos 标记的语料库。 这样我就可以基于它训练我的模型。
到目前为止,我已经参考了许多来源,但每个来源都只是解释如何阅读您的标记语料库以及阅读单词、句子等。以下是我尝试过的一段代码:
from nltk.corpus.reader import TaggedCorpusReader
reader = TaggedCorpusReader('/home/abc/nltk_data/', 'pos_tagged.pos')
reader.words()
reader.tagged_words()
reader.sents()
我想将我的语料库包含在home/nltk_data/corpora/
文件夹中,以便我可以导入我创建的语料库。 请指导我。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.