簡體   English   中英

使用python從其后代中提取主要單詞

[英]Extract main word from its descendants with python

想知道是否有一種方法可以從后代中提取主詞,

例如:

recruitment -> recruit
recruiter -> recruit
recruited -> recruit

我使用wordnet lemmatizer獲得了最后一個,如下所示:

from nltk.stem.wordnet import WordNetLemmatizer
lmtzr = WordNetLemmatizer()
lmtzr.lemmatize('recruited', 'v')

似乎找不到其他解決方案,是否有針對該解決方案的庫或我應該編寫函數?

我認為您是在談論stemming

http://www.nltk.org/api/nltk.stem.html

用於從單詞中除去詞綴的處理接口。 此過程稱為“阻止”。

from nltk.stem.lancaster import LancasterStemmer
st = LancasterStemmer()
st.stem('recruitment')
st.stem('recruiter')
st.stem('recruited')

從nltk嘗試LancasterStemmer

import nltk 
lancaster = nltk.LancasterStemmer()

print lancaster.stem("recruitment")
print lancaster.stem("recruiter")
print lancaster.stem("recruited")

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM