繁体   English   中英

IBM Watson Speech-to-Text“识别音频”方法?

[英]IBM Watson Speech-to-Text "Recognize audio" method?

如何使用recognize方法将音频文件发送到 Speech-to-Text 进行转录? 音频文件在哪里访问? 有没有地方可以放置本地文件的路径、Google 存储位置或下载 URL?

文档说:

在此处输入图片说明

好的,这就是我想做的! 文档说这是方法:

recognize(params, [callback()])

我看到的参数是:

var params = {
  objectMode: true,
  contentType: 'audio/flac',
  model: 'en-US_BroadbandModel',
  keywords: ['colorado', 'tornado', 'tornadoes'],
  keywordsThreshold: 0.5,
  maxAlternatives: 3
};

MediaFileUri有参数吗?

您的链接指向 node.js sdk 文档。 在这种情况下,音频作为参数audio发送,它应该是NodeJS.ReadableStreambuffer 您可以从url创建可读流,在这种情况下,您可以添加:


params.audio = fs.createReadStream(url);

这将需要 url 指向音频文件,而不是带有音频播放器的伪装网页。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM