在spacy中可以獨立進行詞形還原嗎？

Question

我正在使用spacy來預處理數據以進行情緒分析。

我想做的是：

1）詞形還原
2）對詞形詞進行POS標記

但是，由於spacy在調用解析器時立即執行所有進程，因此它會執行兩次所有計算。 是否有禁用非必需計算的選項？

Answer 1

看看語言。 調用方法以查看各種進程如何按順序應用。 沒有多少 - 它基本上是：

doc = nlp.tokenizer(text)
nlp.tagger(doc)
nlp.parser(doc)
nlp.entity(doc)

如果你需要一個不同的序列，你應該編寫自己的函數來將它們串聯起來。

不過，我不確定你的要求是否合理。 如果將POS標記符應用於詞形化文本，則統計模型可能不會很好地執行。 屈折后綴是重要的特征。