繁体   English   中英

twilio API - 如何从视频通话录音的音频部分获取转录文本?

[英]twilio API - how to get transcribed text from audio part of video call recording?

我知道 Twilio 有可能转录语音通话,但是如何使用 Twilio API 转录视频通话的音频部分? 它不必是实时的 - 它可以在视频通话结束后使用录音来完成。

不幸的是,我在“可编程视频”API( https://www.twilio.com/docs/video/api/recordings-resource )中没有找到任何关于转录视频通话的内容,但我相信必须有一些方法可以做它,因为 Twilio 单独存储视频 + 音频。

我可以通过这个 PHP 代码获取现有的录音:

/** @var \Twilio\Rest\Client $twilio */
$twilio->video->recordings($recording_sid)->read();

它返回一个“\Twilio\Rest\Video\V1\RecordingInstance”的实例。 但是,我不确定如何从此录音中获取转录文本。

Twilio Video 不会转录您录制的视频通话中的音频。 如果您想这样做,您必须将录制的音频文件发送到单独的服务以执行转录。

在您的情况下,一旦您拥有RecordingInstance对象,您就可以从media subresource下载它。

然后,您需要将其发送或上传到可以为您进行音频转录的服务。 像 Google Cloud Speech API 或 Azure Cognitive Services 这样的东西可能会为您做到这一点。 请注意,原始录音采用 Matroska 容器格式, .mka文件。 您将需要检查用于转录音频的服务是否可以接受该格式,如果不能,您需要自己翻译音频文件或让 Twilio 使用Video Recording Compositions API进行翻译。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM