簡體   English   中英

NLTK詞性的縮寫參考

[英]Abbreviation Reference for NLTK Parts of Speech

我正在使用nltk查找句子中每個單詞的詞性。 它返回的縮寫詞我都不能完全理解,也找不到很好的文檔。

運行:

import nltk
sample = "There is no spoon."
tokenized_words = nltk.word_tokenize(sample)
tagged_words = nltk.pos_tag(tokenized_words)
print tagged_words

返回:

[('There', 'EX'), ('is', 'VBZ'), ('no', 'DT'), ('spoon', 'NN'), ('.', '.')]

在上面的示例中,我正在尋找DTEX和其余的含義。

到目前為止,我最好的方法是搜索有關使用Python進行自然語言處理的關注縮寫的提及,但是必須有更好的東西。 我確實也找到了一些基於文獻的資源,但是我不知道如何判斷正在使用哪個nltk。

您已經提到的鏈接具有兩個不同的標記集。

有關標簽集文檔,請參見nltk.help.upenn_tagset()nltk.help.brown_tagset()

在此特定示例中,這些標簽來自Penn Treebank標簽集

您還可以通過以下方式了解這些標簽:

nltk.help.upenn_tagset('DT')
nltk.help.upenn_tagset('EX')

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM