繁体   English   中英

使用 Xamarin 和 Microsoft Speech Service API 执行实时连续语音识别

[英]Perform real time continuous speech recognition using Xamarin and Microsoft Speech Service API

我在 Bing Speech API 的文档中看到,可以将录音麦克风输入流式传输到 REST 服务 ( https://docs.microsoft.com/en-us/azure/cognitive-services/speech/home ):

实时连续识别。 语音识别API可以让用户实时将音频转录成文本,并支持接收目前已经识别的单词的中间结果。

但是,我找不到展示如何使用 Xamarin Forms 以跨平台方式实现这一目标的示例

我找到了以下教程: https : //developer.xamarin.com/guides/xamarin-forms/cloud-services/cognitive-services/speech-recognition/

但是在这里,发送到 API 的音频流是一个已经存在的音频文件,但是我想要实现的是流式传输运行应用程序(Android、iOS、UWP)的设备的麦克风输入

任何见解将不胜感激。

恐怕没有与Xamarin兼容的支持实时 Microsoft Speech API 的库。 唯一兼容的是 Bing Speech API,它使用 REST 协议并且不提供实时转录。

实时转录需要完整记录的语音服务 WebSocket 协议 您可以自己实现这个接口,但要可靠地实现它可能是一项相当复杂的任务。

然而,有适用于iOSAndroid 的本机库支持实时流式传输功能。 您可以查看iOS 教程和 Android 教程

然后你可以做的是使用 Xamarin 绑定库将本机库绑定到你的 Xamarin 项目中。 对于 Java 库, 请参阅本教程,对于 Objective-C 库, 请参阅本教程

尤其是创建 Objective-C 绑定可能是一项艰巨的任务,创建一个用作外观的 Objective-C 库通常更容易,然后使用本机库。 您将了解外观库的接口,然后您将能够更轻松地创建绑定。 你也可以考虑要求 Xamarin 团队为你创建绑定,因为他们在 GitHub 上维护着越来越多的第三方库绑定

我有一个使用 Bing Speech 的 跨平台解决方案 让 IOS 工作。 从未测试过 Android 解决方案。

这里有一个很棒的图书馆,应该可以满足您的需求:

https://github.com/NateRickard/Xamarin.Cognitive.BingSpeech

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM