JAVA：如何使用Gazettes与Stanford NLP？

Question

我读了这个常见问题，但我不明白。 我尝试使用此代码：

   Properties pp=new Properties();  
   pp.put("annotators", "tokenize, ssplit, pos, lemma, ner, parse");
   pp.put("ner.useSUTime","false");

   pp.put("useGazettes","true");
   pp.put("gazette","C:\\gaz.txt");

   StanfordCoreNLP s=new StanfordCoreNLP(pp);

这是字符串：“丹成为2008年音乐朋友协会的成员”

公报文件是：

  CLASS Music friends association

但NER不承认“音乐朋友协会”。

我哪里错了？

Answer 1

答案是：

如果使用宪报，则不保证宪报中的文字总是被用作预期类别的成员，并不保证不会选择公报之外的文字。 它只是为CRF提供了另一个训练功能。 如果CRF对其他功能具有更高的权重，则公报功能可能会不堪重负。

因此，无法保证您的短语会以任何方式被标记。 替代方案是

Stanford CoreNLP中包含的regexner或tokensregex工具

JAVA：如何使用Gazettes与Stanford NLP？

问题描述

1 个解决方案

解决方案1
0 已采纳 2016-05-09 15:45:55

JAVA：如何使用Gazettes与Stanford NLP？

问题描述

1 个解决方案

解决方案1 0 已采纳 2016-05-09 15:45:55

解决方案1
0 已采纳 2016-05-09 15:45:55