簡體   English   中英

JAVA:如何使用Gazettes與Stanford NLP?

[英]JAVA: How use Gazettes with Stanford NLP?

我讀了這個常見問題,但我不明白。 我嘗試使用此代碼:

   Properties pp=new Properties();  
   pp.put("annotators", "tokenize, ssplit, pos, lemma, ner, parse");
   pp.put("ner.useSUTime","false");

   pp.put("useGazettes","true");
   pp.put("gazette","C:\\gaz.txt");

   StanfordCoreNLP s=new StanfordCoreNLP(pp);

這是字符串:“丹成為2008年音樂朋友協會的成員”

公報文件是:

  CLASS Music friends association 

但NER不承認“音樂朋友協會”。

我哪里錯了?

答案是:

如果使用憲報,則不保證憲報中的文字總是被用作預期類別的成員,並不保證不會選擇公報之外的文字。 它只是為CRF提供了另一個訓練功能。 如果CRF對其他功能具有更高的權重,則公報功能可能會不堪重負。

因此,無法保證您的短語會以任何方式被標記。 替代方案是

Stanford CoreNLP中包含的regexner或tokensregex工具

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM