簡體 English 中英

如何獲取NLTK中同義詞集的詞網感知頻率？

[英]How to get the wordnet sense frequency of a synset in NLTK?

原文 2013-03-21 15:06:27 6 2 python/ nlp/ nltk/ wordnet/ wsd

根據文檔，我可以這樣在nltk中加載一個帶有感官標記的語料庫：

>>> from nltk.corpus import wordnet_ic
>>> brown_ic = wordnet_ic.ic('ic-brown.dat')
>>> semcor_ic = wordnet_ic.ic('ic-semcor.dat')

我還可以得到definition ， pos ， offset ， examples為這樣的：

>>> wn.synset('dog.n.01').examples
>>> wn.synset('dog.n.01').definition

但是如何從語料庫中獲得同義詞的頻率呢？ 分解問題：

首先，如何多次計數一個同義詞集是否出現一個帶有感官標記的語料庫？
那么下一步就是在給定特定引理的情況下，將所有同義詞集出現的次數除以計數總數。

2 個解決方案

我設法做到了。

from nltk.corpus import wordnet as wn

word = "dog"
synsets = wn.synsets(word)

sense2freq = {}
for s in synsets:
  freq = 0  
  for lemma in s.lemmas:
    freq+=lemma.count()
  sense2freq[s.offset+"-"+s.pos] = freq

for s in sense2freq:
  print s, sense2freq[s]

如果您只需要知道最常見的單詞是什么，則可以執行wn.synsets(word)[0]因為WordNet通常wn.synsets(word)[0]它們從最頻繁的wn.synsets(word)[0]排列到最不頻繁的wn.synsets(word)[0] 。

（來源：Daniel Jurafsky的語音和語言處理第二版）

如何在python nltk和wordnet中獲得單詞/ synset的所有下位詞？

[英]How to get all the hyponyms of a word/synset in python nltk and wordnet?

如何訪問 nltk/wordnet Synset 對象？

[英]How to access the nltk/wordnet Synset object?

NLTK Wordnet Synset用於單詞短語

[英]NLTK Wordnet Synset for word phrase

如何使用Nltk WordNet獲得光澤度給定的感應鍵？

[英]How to get the gloss given sense key using Nltk WordNet?

如何從python腳本中的wordnet：synset中選擇所需的意義

[英]How to select required sense from wordnet:synset in a python script

如何獲得給定偏移 ID 的 WordNet 同義詞集？

[英]How to get the WordNet synset given an offset ID?

如何在 NLTK 的 Wordnet 中檢索目標同義詞集的反義詞同義詞集？

[英]How can I retrieve the antonym synset of a target synset in NLTK's Wordnet?

如何提取WordNet同義詞集的偏移量以提供Python NLTK中的同義詞集？

[英]How do I extract the offset of a WordNet synset give a synset in Python NLTK?

NLTK的WordNet中同義詞集上位詞的列表不完整？

[英]Incomplete list of synset hypernyms in NLTK's WordNet?

NLTK wordnet界面中的第0個synset

[英]0th synset in NLTK wordnet interface

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何在python nltk和wordnet中獲得單詞/ synset的所有下位詞？如何訪問 nltk/wordnet Synset 對象？ NLTK Wordnet Synset用於單詞短語如何使用Nltk WordNet獲得光澤度給定的感應鍵？如何從python腳本中的wordnet：synset中選擇所需的意義如何獲得給定偏移 ID 的 WordNet 同義詞集？如何在 NLTK 的 Wordnet 中檢索目標同義詞集的反義詞同義詞集？如何提取WordNet同義詞集的偏移量以提供Python NLTK中的同義詞集？ NLTK的WordNet中同義詞集上位詞的列表不完整？ NLTK wordnet界面中的第0個synset

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM