為 spacy 解析器創建的每個令牌獲取 Spacy.Vocab.Morphology id

Question

下面的代碼是獲取每個句子的文檔的示例代碼。

獲取文檔

為了獲取每個單詞的屬性，我們使用了文檔，示例代碼如下。

拿到令牌

通過深入研究 spacy 代碼，我可以發現對於每個名詞，我們確實都有與之相關的形態學。

從這個 spacy 的源代碼中查看 IDs(Dictionary) 的值：點擊這里

我的問題：

我無法獲取每個名詞標記的形態學值。 我怎樣才能得到相同的..？

Answer 1

我不確定你對單詞的選擇，但聽起來你在問如何獲得每個標記的形態屬性。 令牌的形態屬性可以這樣查找：

>>> nlp = spacy.load('en')
>>> doc = nlp('Dogs are friendly.')
>>> token = doc[0]  # Dogs
>>> nlp.vocab.morphology.tag_map[token.tag_]
{74: 91, 'Number': 'plur'}
>>>

Answer 2

如果由於某種原因你的nlp.vocab.morphology.tag_map是None我能夠通過令牌本身獲得大部分形態信息：

import spacy

nlp = spacy.load('en')
for tok in nlp('Dogs are friendly.'):
    print(f"{tok} {tok.morph.to_dict()}")

為 spacy 解析器創建的每個令牌獲取 Spacy.Vocab.Morphology id

問題描述

2 個解決方案

解決方案1
2 2018-04-14 20:34:55

解決方案2
0 2021-12-03 00:25:41

為 spacy 解析器創建的每個令牌獲取 Spacy.Vocab.Morphology id

問題描述

2 個解決方案

解決方案1 2 2018-04-14 20:34:55

解決方案2 0 2021-12-03 00:25:41

解決方案1
2 2018-04-14 20:34:55

解決方案2
0 2021-12-03 00:25:41