繁体   English   中英

IBM Watson Speech to Text Websocket关闭(代码为1000)没有结果

[英]IBM Watson Speech to Text Websocket closing (with code 1000) without result

我尝试使用ws包通过websocket消费基本的语音到文本服务。 但在成功打开连接并发送初始消息后,我从未获得listening状态。 我还尝试发送音频和空二进制文件(表示上传过程已完成),但服务器始终返回代码为1000 close

以下是我的代码

'use strict';

var fs = require('fs');
var request = require('request');
var WS = require('ws');

var wsURI = 'wss://stream.watsonplatform.net/speech-to-text/api/v1/recognize?watson-token=[TOKEN]&model=en-UK_NarrowbandModell&x-watson-learning-opt-out=1';
var getTokenForm = {
  method: 'GET',
  uri: 'https://[USER_ID]:[PASSWORD]@stream.watsonplatform.net/authorization/api/v1/token?url=https://stream.watsonplatform.net/speech-to-text/api',
};
var filepath = 'C:/Temp/test1.wav';

request(getTokenForm, function(error, response, body) {
  wsURI = wsURI.replace('[TOKEN]', body);
  var message = {
    'action': 'start',
    'content-type': 'audio/wav',
    'continuous': true,
    'inactivity_timeout': -1
  };
  var ws = new WS(wsURI);

  ['message', 'error', 'close', 'open', 'connection'].forEach(function(eventName) {
    ws.on(eventName, console.log.bind(console, eventName + ' event: '));
  });

  ws.on('open', function(evt) {
    ws.send(JSON.stringify(message));
    setTimeout(function timeout() {
      var readStream = fs.createReadStream(filepath);
      readStream.on('data', function(data) {
        ws.send(data, {
          binary: true,
          mask: false,
        });
      });

      readStream.on('end', function() {
        ws.send(new Buffer(0), {
          binary: true,
          mask: false,
        });
      });
    }, 1000);
  });

  ws.on('close', function(data) {
    console.log(data)
  });
});

还尝试直接发送文件(没有流)。

var sound = fs.readFileSync(filepath);
ws.send(sound, { binary: true, mask: false});

并尝试添加自定义标头Authorization

var authorization = 'Basic ' + new Buffer('USER_ID:PASSWORD').toString('base64');
var ws = new WS(wsURI, {
    headers: {
        'Authorization': authorization,
    }
});

但到目前为止没有运气。

这里有几件事。 主要问题是查询字符串中的模型有一个拼写错误 - 最后应该只有一个'l'。 (虽然没有回复错误消息是我要向团队报告的服务中的错误。)

所以,修复它,你会得到一个错误,框架应该被屏蔽。 这是一个简单的修复,只需在两个地方切换mask: falsetrue

然后,一旦您完成发送音频和结束消息,服务将发送您的最终结果,然后发送另一个{"state": "listening"}消息。 第二种state: listening应该是您关闭连接的触发器。 否则它将最终超时并自动关闭(当您发送没有语音的音频时,不会在您没有发送任何数据的情况下应用inactivity_timeout 。)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM