繁体   English   中英

JAVA:如何使用Gazettes与Stanford NLP?

[英]JAVA: How use Gazettes with Stanford NLP?

我读了这个常见问题,但我不明白。 我尝试使用此代码:

   Properties pp=new Properties();  
   pp.put("annotators", "tokenize, ssplit, pos, lemma, ner, parse");
   pp.put("ner.useSUTime","false");

   pp.put("useGazettes","true");
   pp.put("gazette","C:\\gaz.txt");

   StanfordCoreNLP s=new StanfordCoreNLP(pp);

这是字符串:“丹成为2008年音乐朋友协会的成员”

公报文件是:

  CLASS Music friends association 

但NER不承认“音乐朋友协会”。

我哪里错了?

答案是:

如果使用宪报,则不保证宪报中的文字总是被用作预期类别的成员,并不保证不会选择公报之外的文字。 它只是为CRF提供了另一个训练功能。 如果CRF对其他功能具有更高的权重,则公报功能可能会不堪重负。

因此,无法保证您的短语会以任何方式被标记。 替代方案是

Stanford CoreNLP中包含的regexner或tokensregex工具

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM