[英]Extract main word from its descendants with python
想知道是否有一種方法可以從后代中提取主詞,
例如:
recruitment -> recruit
recruiter -> recruit
recruited -> recruit
我使用wordnet lemmatizer獲得了最后一個,如下所示:
from nltk.stem.wordnet import WordNetLemmatizer
lmtzr = WordNetLemmatizer()
lmtzr.lemmatize('recruited', 'v')
似乎找不到其他解決方案,是否有針對該解決方案的庫或我應該編寫函數?
我認為您是在談論stemming
:
http://www.nltk.org/api/nltk.stem.html
用於從單詞中除去詞綴的處理接口。 此過程稱為“阻止”。
from nltk.stem.lancaster import LancasterStemmer
st = LancasterStemmer()
st.stem('recruitment')
st.stem('recruiter')
st.stem('recruited')
從nltk嘗試LancasterStemmer
import nltk
lancaster = nltk.LancasterStemmer()
print lancaster.stem("recruitment")
print lancaster.stem("recruiter")
print lancaster.stem("recruited")
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.