IBM Watson Speech-to-Text“识别音频”方法？

Question

如何使用recognize方法将音频文件发送到 Speech-to-Text 进行转录？ 音频文件在哪里访问？ 有没有地方可以放置本地文件的路径、Google 存储位置或下载 URL？

文档说：

好的，这就是我想做的！ 文档说这是方法：

recognize(params, [callback()])

我看到的参数是：

var params = {
  objectMode: true,
  contentType: 'audio/flac',
  model: 'en-US_BroadbandModel',
  keywords: ['colorado', 'tornado', 'tornadoes'],
  keywordsThreshold: 0.5,
  maxAlternatives: 3
};

MediaFileUri有参数吗？

Answer 1

您的链接指向 node.js sdk 文档。 在这种情况下，音频作为参数audio发送，它应该是NodeJS.ReadableStream或buffer 。 您可以从url创建可读流，在这种情况下，您可以添加：


params.audio = fs.createReadStream(url);

这将需要 url 指向音频文件，而不是带有音频播放器的伪装网页。

IBM Watson Speech-to-Text“识别音频”方法？

问题描述

1 个解决方案

解决方案1
1 已采纳 2020-03-20 08:40:08

IBM Watson Speech-to-Text“识别音频”方法？

问题描述

1 个解决方案

解决方案1 1 已采纳 2020-03-20 08:40:08

解决方案1
1 已采纳 2020-03-20 08:40:08