[英]OpenNLP find() method
目前,我正在尝试在文档中查找名称。 我使用以下方法查找名称:
find(String[] tokens)
我也在下面找到了这种方法:
find(String[] tokens,String[][] additionalContext)
我可以用这种方法做什么以及如何使用它?
根据opennlp.tools.namefind.NameFinderME apidocs :
public Span[] find(String[] tokens, String[][] additionalContext)
生成给定序列(通常是句子)的名称标签,返回任何已标识名称的标记范围。
参数:
tokens
-令牌或序列中的单词的数组,通常是一个句子。additionalContext
基于句子外部上下文但也应使用的功能。返回:每个所标识名称的跨度数组。
话虽如此,请考虑您的令牌是:
String[] tokens = { "lorem", "ipsum", "dolor", "sit", "amet", "adipiscing", "elit" };
但是,您还需要考虑以下功能,“ 这些功能基于句子之外的上下文,但也应使用 ”:
String[][] additionalContext = {
{ "nullam", "fermentum", "justo", "non", "leo", "rhoncus", "blandit" },
{ "phasellus", "at", "diam", "mattis", "arcu", "congue", "consequat" },
{ "integer", "at", "tincidunt", "turpis", "eget", "pulvinar", "nisl" } };
这样,您可以调用find(tokens, additionalContext)
。
请注意,根据GitHub上的代码 , find(String[] tokens)
实际上是find(tokens, EMPTY)
(和String[][] EMPTY = new String[0][0]
)。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.