如何在列表中保存NLTK索引結果？

Question

我正在使用NLTK在文本中查找單詞。 我需要將一致性函數的結果保存到列表中。 這個問題已在這里提出，但我看不出變化。 我試圖通過以下方式找到函數的returnde值的類型：

type(text.concordance('myword'))

結果是：

<class 'NoneType'>

Answer 1

通過檢查ConcordanceIndex的源代碼，我們可以看到結果打印到stdout。 如果不能將stdout重定向到文件，則必須重新實現ConcordanceIndex.print_concordance ，以便返回結果而不是將其打印到stdout。

碼：

def concordance(ci, word, width=75, lines=25):
    """
    Rewrite of nltk.text.ConcordanceIndex.print_concordance that returns results
    instead of printing them. 

    See:
    http://www.nltk.org/api/nltk.html#nltk.text.ConcordanceIndex.print_concordance
    """
    half_width = (width - len(word) - 2) // 2
    context = width // 4 # approx number of words of context

    results = []
    offsets = ci.offsets(word)
    if offsets:
        lines = min(lines, len(offsets))
        for i in offsets:
            if lines <= 0:
                break
            left = (' ' * half_width +
                    ' '.join(ci._tokens[i-context:i]))
            right = ' '.join(ci._tokens[i+1:i+context])
            left = left[-half_width:]
            right = right[:half_width]
            results.append('%s %s %s' % (left, ci._tokens[i], right))
            lines -= 1

    return results

用法：

from nltk.book import text1
from  nltk.text import ConcordanceIndex

ci = ConcordanceIndex(text1.tokens)
results = concordance(ci, 'circumstances')

print(type(results))
<class 'list'>

Answer 2

要使用文本一致性，您需要實例化NLTK Text()對象，然后對該對象使用concordance()方法：

import nltk.corpus  
from nltk.text import Text  
moby = Text(nltk.corpus.gutenberg.words('melville-moby_dick.txt'))

這里我們在文本文件melville-moby_dick.txt上實例化一個Text對象，然后我們就可以使用這個方法了：

moby.concordance("monster")

如果你在這里有一個NonType，它會看起來是因為你沒有創建任何Text對象，所以你的變量text是None 。

Answer 3

Text類現在有一個concordance_list函數。 例如：

from nltk.corpus import gutenberg
from nltk.text import Text

corpus = gutenberg.words('melville-moby_dick.txt')
text = Text(corpus)
con_list = text.concordance_list("monstrous")

如何在列表中保存NLTK索引結果？

問題描述

3 個解決方案

解決方案1
3 已采納 2017-12-05 12:13:26

解決方案2
0 2017-12-05 12:04:50

解決方案3
0 2019-07-22 09:39:54

如何在列表中保存NLTK索引結果？

問題描述

3 個解決方案

解決方案1 3 已采納 2017-12-05 12:13:26

解決方案2 0 2017-12-05 12:04:50

解決方案3 0 2019-07-22 09:39:54

解決方案1
3 已采納 2017-12-05 12:13:26

解決方案2
0 2017-12-05 12:04:50

解決方案3
0 2019-07-22 09:39:54