[英]How to lemmatise nouns?
我正在尝试使用 NLTK.stem Wordlemmatizer 将诸如“升级”之类的词归结为“升级”。
word_lem = WordNetLemmatizer()
print( word_lem.lemmatize("escalation", pos = "n")
应该使用哪个 pos 标签来获得像“升级”这样的结果
首先,请注意:
词干提取通常是指一种粗略的启发式过程,该过程会切断单词的结尾,以希望在大多数情况下正确地实现这一目标,并且通常包括删除派生词缀。 词形还原通常是指使用词汇和词法分析正确地做事,通常旨在仅删除屈折词尾并返回单词的基本或字典形式,这被称为引理。
现在,如果您希望获得“升级”和“升级”的规范形式,您可以使用总结器,例如 Porter stemmer。
from nltk.stem import PorterStemmer
ps = PorterStemmer()
print(ps.stem("escalate"))
print(ps.stem("escalation"))
虽然结果是escal
,但两个词都是一样的。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.