[英]JAVA: How use Gazettes with Stanford NLP?
我讀了這個常見問題,但我不明白。 我嘗試使用此代碼:
Properties pp=new Properties();
pp.put("annotators", "tokenize, ssplit, pos, lemma, ner, parse");
pp.put("ner.useSUTime","false");
pp.put("useGazettes","true");
pp.put("gazette","C:\\gaz.txt");
StanfordCoreNLP s=new StanfordCoreNLP(pp);
這是字符串:“丹成為2008年音樂朋友協會的成員”
公報文件是:
CLASS Music friends association
但NER不承認“音樂朋友協會”。
我哪里錯了?
答案是:
如果使用憲報,則不保證憲報中的文字總是被用作預期類別的成員,並不保證不會選擇公報之外的文字。 它只是為CRF提供了另一個訓練功能。 如果CRF對其他功能具有更高的權重,則公報功能可能會不堪重負。
因此,無法保證您的短語會以任何方式被標記。 替代方案是
Stanford CoreNLP中包含的regexner或tokensregex工具
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.