簡體   English   中英

如何使用南非荷蘭語單詞作為nltk語料庫訪問文本文件

[英]How to access a text file with Afrikaans language words as a nltk corpus

我有一個帶有南非荷蘭語語言的純文本句子的文本文件。 我希望能夠在此文本文件上執行nltk語料庫功能,但是找不到如何執行此操作的任何示例。

我想做一些事情,例如:

mytext.concordance("woord")
mytext.similar("woord")

誰能幫我?

設法弄清楚了一些事情:

# How to load a text file as a corpus.
import nltk
from nltk.corpus import PlaintextCorpusReader
from nltk.corpus.util import LazyCorpusLoader
afrikaans = LazyCorpusLoader('afrikaans', PlaintextCorpusReader, r'(?!\.).*\.txt')
afrikaans.sents()[1]
af = nltk.Text(afrikaans.words())
af.concordance("mense")

假設您的語料庫文本文件位於C:\\ nltk_data \\ corpora \\ afrikaans \\ afrikaans.txt中

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM