簡體   English   中英

在spacy中可以獨立進行詞形還原嗎?

[英]Is it possible to do lemmatization independently in spacy?

我正在使用spacy來預處理數據以進行情緒分析。

我想做的是:

1)詞形還原
2)對詞形詞進行POS標記

但是,由於spacy在調用解析器時立即執行所有進程,因此它會執行兩次所有計算。 是否有禁用非必需計算的選項?

看看語言。 調用方法以查看各種進程如何按順序應用。 沒有多少 - 它基本上是:

doc = nlp.tokenizer(text)
nlp.tagger(doc)
nlp.parser(doc)
nlp.entity(doc)

如果你需要一個不同的序列,你應該編寫自己的函數來將它們串聯起來。

不過,我不確定你的要求是否合理。 如果將POS標記符應用於詞形化文本,則統計模型可能不會很好地執行。 屈折后綴是重要的​​特征。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM