[英]How to access a text file with Afrikaans language words as a nltk corpus
我有一個帶有南非荷蘭語語言的純文本句子的文本文件。 我希望能夠在此文本文件上執行nltk語料庫功能,但是找不到如何執行此操作的任何示例。
我想做一些事情,例如:
mytext.concordance("woord")
mytext.similar("woord")
誰能幫我?
設法弄清楚了一些事情:
# How to load a text file as a corpus.
import nltk
from nltk.corpus import PlaintextCorpusReader
from nltk.corpus.util import LazyCorpusLoader
afrikaans = LazyCorpusLoader('afrikaans', PlaintextCorpusReader, r'(?!\.).*\.txt')
afrikaans.sents()[1]
af = nltk.Text(afrikaans.words())
af.concordance("mense")
假設您的語料庫文本文件位於C:\\ nltk_data \\ corpora \\ afrikaans \\ afrikaans.txt中
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.