[英]Service issue with IBM Watson Natural Language Understanding
[英]IBM Natural Language Understanding - Return page title
我正在使用 IBM Cloud NLU 从 URL 列表中分析一系列网页。
API 成功返回实体,我也可以使用返回分析的内容
return_analyzed_text => 'true';
我的问题是除了分析的文本之外,我还需要返回网页标题。
到目前为止,我的解决方案是分别对每个页面进行 CURL,从 DOM 中提取标题元素,并将单独提取的标题信息与 return_analyzed_text 字符串相关联。 这个额外的步骤为该过程增加了大量时间,并且似乎没有必要,因为 API 显然已经在卷曲页面。
有没有办法让API返回文档标题? (或任何其他 DOM 元素,如 H1?)
如果您要求metadata
您可以让服务返回标题 - https://cloud.ibm.com/apidocs/natural-language-understanding#metadata
根据文档,除了您已经传入请求元数据的参数之外,您还需要传入这些参数。
{
"url": "www.ibm.com",
"features": {
"metadata": {}
}
}
这将为您的 API 使用计数添加额外的单位。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.