JAVA：如何使用Gazettes與Stanford NLP？

Question

我讀了這個常見問題，但我不明白。 我嘗試使用此代碼：

   Properties pp=new Properties();  
   pp.put("annotators", "tokenize, ssplit, pos, lemma, ner, parse");
   pp.put("ner.useSUTime","false");

   pp.put("useGazettes","true");
   pp.put("gazette","C:\\gaz.txt");

   StanfordCoreNLP s=new StanfordCoreNLP(pp);

這是字符串：“丹成為2008年音樂朋友協會的成員”

公報文件是：

  CLASS Music friends association

但NER不承認“音樂朋友協會”。

我哪里錯了？

Answer 1

答案是：

如果使用憲報，則不保證憲報中的文字總是被用作預期類別的成員，並不保證不會選擇公報之外的文字。 它只是為CRF提供了另一個訓練功能。 如果CRF對其他功能具有更高的權重，則公報功能可能會不堪重負。

因此，無法保證您的短語會以任何方式被標記。 替代方案是

Stanford CoreNLP中包含的regexner或tokensregex工具

JAVA：如何使用Gazettes與Stanford NLP？

問題描述

1 個解決方案

解決方案1
0 已采納 2016-05-09 15:45:55

JAVA：如何使用Gazettes與Stanford NLP？

問題描述

1 個解決方案

解決方案1 0 已采納 2016-05-09 15:45:55

解決方案1
0 已采納 2016-05-09 15:45:55