[英]Incomplete list of synset hypernyms in NLTK's WordNet?
嘗試通過WN NLTK的界面恢復任何給定WordNet同義詞集的上位詞時,我得到的是與WN的Web搜索界面不同的結果。 例如:
from nltk.corpus import wordnet as wn
bank6ss = wn.synsets("bank")[5] # 'bank' as gambling house funds
bank6ss.hypernyms()
# returns [Synset('funds.n.01')]
也就是說,僅找到一個上位字母(例如, instance_hypernyms()
找不到其他上位字母)。 但是,在查看WN的Web界面時 ,這種“銀行”感覺在“直接上位詞”下列出了其他幾個上位詞:
funds, finances, monetary resource, cash in hand, pecuniary resource
是什么可以解釋這種差異,如何在NLTK的WordNet中獲得更長的上位列表?
我的NLTK安裝中使用的WordNet版本是3.0。
我才意識到,我正在尋找在兩個不同類型的輸出:什么是NLTK共發現返回的上位詞同義詞集合 ( Synset['funds.n.01']
而在Web界面上位的名單是由引理屬於那個同義詞
為了完全回答這個問題,可以在NLTK中恢復以下引理列表:
from nltk.corpus import wordnet as wn
bank6ss = wn.synsets("bank")[5] # 'bank' as gambling house funds
hn1ss = bank6ss.hypernyms()[0]
hn1ss.lemmas()
# returns [Lemma('funds.n.01.funds'),
# Lemma('funds.n.01.finances'),
# Lemma('funds.n.01.monetary_resource'),
# Lemma('funds.n.01.cash_in_hand'),
# Lemma('funds.n.01.pecuniary_resource')]
或者,如果只對引理名稱感興趣:
hn1ss.lemma_names()
# returns [u'funds',
# u'finances',
# u'monetary_resource',
# u'cash_in_hand',
# u'pecuniary_resource']
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.