[英]Using Counter on a list of Spacy tokens returns a non unique dict of the tokens
如果令牌具有相同的文本,則令牌不等效,它們必須在同一文檔 object 中的相同 position 中。但是屏幕截圖中的 output(不要發布文本屏幕截圖...)只是一個repr
token,也就是它的文本。
如果您只想計算文本,請使用token.text
,如下所示:
from collections import Counter
import spacy
nlp = spacy.blank("en")
doc = nlp("this is text, this is text")
out = Counter([tok.text for tok in doc])
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.