IBM Natural Language Understanding - 返回页面标题

Question

我正在使用 IBM Cloud NLU 从 URL 列表中分析一系列网页。

API 成功返回实体，我也可以使用返回分析的内容

return_analyzed_text => 'true';

我的问题是除了分析的文本之外，我还需要返回网页标题。

到目前为止，我的解决方案是分别对每个页面进行 CURL，从 DOM 中提取标题元素，并将单独提取的标题信息与 return_analyzed_text 字符串相关联。 这个额外的步骤为该过程增加了大量时间，并且似乎没有必要，因为 API 显然已经在卷曲页面。

有没有办法让API返回文档标题？ （或任何其他 DOM 元素，如 H1？）

Answer 1

根据文档，除了您已经传入请求元数据的参数之外，您还需要传入这些参数。

{
  "url": "www.ibm.com",
  "features": {
    "metadata": {}
  }
}

这将为您的 API 使用计数添加额外的单位。