簡體   English   中英

如何在Spacy模型中添加專有名詞作為vocab?

[英]How to add proper nouns as vocab to Spacy models?

我正在將Spacy 1.8.0與Python結合使用,我想使用Spacy對醫學文檔進行分析。 有一種方法可以將新的實體類型添加到spacy的命名實體識別器中。 但是,是否可以在spcay的vocab中添加葯品名稱作為專有名詞? 還是需要通過培訓spacy NER來添加它們? 謝謝

我不確定您要做什么...但是下面是一些可能性的解決方案。

  1. 您有感興趣的葯品的完整列表...

    一世。 並且您想要一個特殊的規則來對這些字符串進行標記化:不建議使用此方法,但原則上可以將特殊情況添加到標記化器中。

    II。 並且您只想找到它們:然后,您應該在創建文檔后使用Matcher有效地找到它們。 然后,您可以使用找到的跨度執行所需的操作。 如果需要,可以使它們成為代詞。

  2. 您沒有感興趣的葯品的完整列表...

    一世。 但您通常希望識別它們:然后,您需要訓練NER模型來識別它們。 要生成訓練數據,您可以拿一大堆論文,然后使用Matcher查找已知的葯品,以獲取一大堆例句。 那你訓練...

以后的編輯:為了清楚起見,Vocab僅存儲字符串並為它們分配一個唯一的ID,以便在引擎蓋下使用。 由Tagger決定是否為PRON。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM