簡體   English   中英

為 spacy 解析器創建的每個令牌獲取 Spacy.Vocab.Morphology id

[英]Get Spacy.Vocab.Morphology ids for every Tokens created by spacy parser

下面的代碼是獲取每個句子的文檔的示例代碼。

獲取文檔

為了獲取每個單詞的屬性,我們使用了文檔,示例代碼如下。

拿到令牌

通過深入研究 spacy 代碼,我可以發現對於每個名詞,我們確實都有與之相關的形態學。

從這個 spacy 的源代碼中查看 IDs(Dictionary) 的值: 點擊這里

我的問題:

我無法獲取每個名詞標記的形態學值。 我怎樣才能得到相同的..?

我不確定你對單詞的選擇,但聽起來你在問如何獲得每個標記的形態屬性。 令牌的形態屬性可以這樣查找:

>>> nlp = spacy.load('en')
>>> doc = nlp('Dogs are friendly.')
>>> token = doc[0]  # Dogs
>>> nlp.vocab.morphology.tag_map[token.tag_]
{74: 91, 'Number': 'plur'}
>>> 

如果由於某種原因你的nlp.vocab.morphology.tag_mapNone我能夠通過令牌本身獲得大部分形態信息:

import spacy

nlp = spacy.load('en')
for tok in nlp('Dogs are friendly.'):
    print(f"{tok} {tok.morph.to_dict()}")

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM