繁体   English   中英

IBM Natural Language Understanding - 返回页面标题

[英]IBM Natural Language Understanding - Return page title

我正在使用 IBM Cloud NLU 从 URL 列表中分析一系列网页。

API 成功返回实体,我也可以使用返回分析的内容

return_analyzed_text => 'true';

我的问题是除了分析的文本之外,我还需要返回网页标题。

到目前为止,我的解决方案是分别对每个页面进行 CURL,从 DOM 中提取标题元素,并将单独提取的标题信息与 return_analyzed_text 字符串相关联。 这个额外的步骤为该过程增加了大量时间,并且似乎没有必要,因为 API 显然已经在卷曲页面。

有没有办法让API返回文档标题? (或任何其他 DOM 元素,如 H1?)

如果您要求metadata您可以让服务返回标题 - https://cloud.ibm.com/apidocs/natural-language-understanding#metadata

根据文档,除了您已经传入请求元数据的参数之外,您还需要传入这些参数。

{
  "url": "www.ibm.com",
  "features": {
    "metadata": {}
  }
}

这将为您的 API 使用计数添加额外的单位。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM