繁体   English   中英

OpenNLP find()方法

[英]OpenNLP find() method

目前,我正在尝试在文档中查找名称。 我使用以下方法查找名称:

find(String[] tokens)

我也在下面找到了这种方法:

find(String[] tokens,String[][] additionalContext)

我可以用这种方法做什么以及如何使用它?

根据opennlp.tools.namefind.NameFinderME apidocs

 public Span[] find(String[] tokens, String[][] additionalContext) 

生成给定序列(通常是句子)的名称标签,返回任何已标识名称的标记范围。

参数:

  • tokens -令牌或序列中的单词的数组,通常是一个句子。
  • additionalContext基于句子外部上下文但也应使用的功能。

返回:每个所标识名称的跨度数组。

话虽如此,请考虑您的令牌是:

String[] tokens = { "lorem", "ipsum", "dolor", "sit", "amet", "adipiscing", "elit" };

但是,您还需要考虑以下功能,“ 这些功能基于句子之外的上下文,但也应使用 ”:

String[][] additionalContext = { 
    { "nullam", "fermentum", "justo", "non", "leo", "rhoncus", "blandit" },
    { "phasellus", "at", "diam", "mattis", "arcu", "congue", "consequat" },
    { "integer", "at", "tincidunt", "turpis", "eget", "pulvinar", "nisl" } };

这样,您可以调用find(tokens, additionalContext)

请注意,根据GitHub上代码find(String[] tokens)实际上是find(tokens, EMPTY) (和String[][] EMPTY = new String[0][0] )。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM