簡體   English   中英

NLTK的WordNet中同義詞集上位詞的列表不完整?

[英]Incomplete list of synset hypernyms in NLTK's WordNet?

嘗試通過WN NLTK的界面恢復任何給定WordNet同義詞集的上位詞時,我得到的是與WN的Web搜索界面不同的結果。 例如:

from nltk.corpus import wordnet as wn
bank6ss = wn.synsets("bank")[5]  # 'bank' as gambling house funds
bank6ss.hypernyms()
# returns [Synset('funds.n.01')]

也就是說,僅找到一個上位字母(例如, instance_hypernyms()找不到其他上位字母)。 但是,在查看WN的Web界面時 ,這種“銀行”感覺在“直接上位詞”下列出了其他幾個上位詞:

funds, finances, monetary resource, cash in hand, pecuniary resource

是什么可以解釋這種差異,如何在NLTK的WordNet中獲得更長的上位列表?

我的NLTK安裝中使用的WordNet版本是3.0。

我才意識到,我正在尋找在兩個不同類型的輸出:什么是NLTK共發現返回的上位詞同義詞集合Synset['funds.n.01']而在Web界面上位的名單是由引理屬於那個同義詞

為了完全回答這個問題,可以在NLTK中恢復以下引理列表:

from nltk.corpus import wordnet as wn
bank6ss = wn.synsets("bank")[5]  # 'bank' as gambling house funds
hn1ss = bank6ss.hypernyms()[0]
hn1ss.lemmas()
# returns [Lemma('funds.n.01.funds'), 
#   Lemma('funds.n.01.finances'),
#   Lemma('funds.n.01.monetary_resource'), 
#   Lemma('funds.n.01.cash_in_hand'),
#   Lemma('funds.n.01.pecuniary_resource')]

或者,如果只對引理名稱感興趣:

hn1ss.lemma_names()
# returns [u'funds',
#   u'finances',
#   u'monetary_resource',
#   u'cash_in_hand',
#   u'pecuniary_resource']

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM