繁体   English   中英

使用Google NL API和Open Calais API提取命名实体

[英]Named entities extraction with Google NL API and Open Calais API

我正在尝试从文本中识别命名实体,并将其分类为人员,地点和组织。 我正在使用Google提供的Cloud Natural Language API和Open Calais API来标识命名实体。

  1. 当我输入包含“中国”一词的文本时,Google NL API将其识别为“人”类型。 但是,其在文档中的上下文含义将其作为一个国家来处理。 Google NL API是否能够根据文本上下文提供实体? 如果是这样,请让我知道我在想什么。

  2. 如果文字中包含“ obama”一词,则Google NL API将“ Obama”输出为Person,而Open Calais API将“ Barak Obama”标识为Person。 为什么会这样呢? 还有什么其他方法可以从文本中获取确切的命名实体,例如Open Calais返回的实体?

关于(1),能否请您分享一下句子? 我尝试了几句话,例如“我要去中国旅行”或“您认识中国的任何人”,并且确实返回了Location作为中国的类型(您可以在https://cloud.google上快速尝试。 com / natural-language /

关于(2),NL API从文本中提取实体。 因此,如果文本中包含“奥巴马”,则将提取“奥巴马”,如果文本是“巴拉克·奥巴马”,则将提取为“奥巴马”。 但是,它将在正确的Wikipedia页面上正确解决这两种情况,并为两种情况返回相同的MID。 因此,您也可以从中提取信息。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM