如何使用南非荷蘭語單詞作為nltk語料庫訪問文本文件

Question

我有一個帶有南非荷蘭語語言的純文本句子的文本文件。 我希望能夠在此文本文件上執行nltk語料庫功能，但是找不到如何執行此操作的任何示例。

我想做一些事情，例如：

mytext.concordance("woord")
mytext.similar("woord")

誰能幫我？

Answer 1

設法弄清楚了一些事情：

# How to load a text file as a corpus.
import nltk
from nltk.corpus import PlaintextCorpusReader
from nltk.corpus.util import LazyCorpusLoader
afrikaans = LazyCorpusLoader('afrikaans', PlaintextCorpusReader, r'(?!\.).*\.txt')
afrikaans.sents()[1]
af = nltk.Text(afrikaans.words())
af.concordance("mense")

假設您的語料庫文本文件位於C：\\ nltk_data \\ corpora \\ afrikaans \\ afrikaans.txt中

如何使用南非荷蘭語單詞作為nltk語料庫訪問文本文件

問題描述

1 個解決方案

解決方案1
1 已采納 2013-01-10 21:10:25

如何使用南非荷蘭語單詞作為nltk語料庫訪問文本文件

問題描述

1 個解決方案

解決方案1 1 已采納 2013-01-10 21:10:25

解決方案1
1 已采納 2013-01-10 21:10:25