[英]How to add proper nouns as vocab to Spacy models?
我正在將Spacy 1.8.0與Python結合使用,我想使用Spacy對醫學文檔進行分析。 有一種方法可以將新的實體類型添加到spacy的命名實體識別器中。 但是,是否可以在spcay的vocab中添加葯品名稱作為專有名詞? 還是需要通過培訓spacy NER來添加它們? 謝謝
我不確定您要做什么...但是下面是一些可能性的解決方案。
您有感興趣的葯品的完整列表...
一世。 並且您想要一個特殊的規則來對這些字符串進行標記化:不建議使用此方法,但原則上可以將特殊情況添加到標記化器中。
II。 並且您只想找到它們:然后,您應該在創建文檔后使用Matcher有效地找到它們。 然后,您可以使用找到的跨度執行所需的操作。 如果需要,可以使它們成為代詞。
您沒有感興趣的葯品的完整列表...
一世。 但您通常希望識別它們:然后,您需要訓練NER模型來識別它們。 要生成訓練數據,您可以拿一大堆論文,然后使用Matcher查找已知的葯品,以獲取一大堆例句。 那你訓練...
以后的編輯:為了清楚起見,Vocab僅存儲字符串並為它們分配一個唯一的ID,以便在引擎蓋下使用。 由Tagger決定是否為PRON。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.