[英]Custom NER for identifying products
我正在嘗試為產品名稱及其型號構建自定義命名實體提取器。
我的用例包含這樣的句子:“Microsoft 使用產品 ABC-300 並將其與 ASQ 集成”。 上句中提到的產品是:ABC-300和ASQ
我已經嘗試使用斯坦福和 Spacy NER,兩者的准確性都低於預期。
是否有任何在段落或句子中包含產品名稱的數據集可用於訓練自定義 NER 模型? 用於訓練的句子可以是簡單的,也可以是復雜的。 任何類型的數據都是有用的。
任何關於如何用較少的訓練數據解決這個問題的線索也將不勝感激。
一種可能的解決方案是使用 TokensRegexNERAnnotator ( https://stanfordnlp.github.io/CoreNLP/regexner.html )
這是假設您可以“正則表達式”產品名稱
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.