繁体   English   中英

如何对名词进行词形还原?

[英]How to lemmatise nouns?

我正在尝试使用 NLTK.stem Wordlemmatizer 将诸如“升级”之类的词归结为“升级”。

word_lem = WordNetLemmatizer()

print( word_lem.lemmatize("escalation", pos = "n")

应该使用哪个 pos 标签来获得像“升级”这样的结果

首先,请注意

词干提取通常是指一种粗略的启发式过程,该过程会切断单词的结尾,以希望在大多数情况下正确地实现这一目标,并且通常包括删除派生词缀。 词形还原通常是指使用词汇和词法分析正确地做事,通常旨在仅删除屈折词尾并返回单词的基本或字典形式,这被称为引理。

现在,如果您希望获得“升级”和“升级”的规范形式,您可以使用总结器,例如 Porter stemmer。

from nltk.stem import PorterStemmer

ps = PorterStemmer()
print(ps.stem("escalate"))
print(ps.stem("escalation"))

虽然结果是escal ,但两个词都是一样的。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM