[英]Is it possible to do lemmatization independently in spacy?
我正在使用spacy來預處理數據以進行情緒分析。
我想做的是:
1)詞形還原
2)對詞形詞進行POS標記
但是,由於spacy在調用解析器時立即執行所有進程,因此它會執行兩次所有計算。 是否有禁用非必需計算的選項?
看看語言。 調用方法以查看各種進程如何按順序應用。 沒有多少 - 它基本上是:
doc = nlp.tokenizer(text)
nlp.tagger(doc)
nlp.parser(doc)
nlp.entity(doc)
如果你需要一個不同的序列,你應該編寫自己的函數來將它們串聯起來。
不過,我不確定你的要求是否合理。 如果將POS標記符應用於詞形化文本,則統計模型可能不會很好地執行。 屈折后綴是重要的特征。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.