繁体 English 中英

通过iOS上的麦克风输入进行语音活动检测

[英]Voice Activity Detection from mic input on iOS

原文 2017-08-06 05:38:22 1 1 ios/ swift/ artificial-intelligence/ voice-recognition/ voice-recording

我正在开发一款基于语音AI的iOS应用； 即，它的目的是从麦克风获取语音输入，将其转换为文本，发送给AI代理，然后通过扬声器输出返回的文本。 尽管使用按钮来开始和停止录制语音（SpeechKit用于语音识别，API.AI用于AI，亚马逊的Polly用于输出），但我已经完成了所有工作。

我需要做的是始终保持麦克风开启，并在用户开始和结束通话时自动开始和停止用户语音的录制。 这款应用是为非传统的环境而开发的，用户将无法访问屏幕（但他们将拥有用于记录其文本的高端shot弹枪麦克风）。

我的研究表明，这一难题被称为“语音活动检测”，似乎是整个基于语音的AI系统中最困难的步骤之一。

我希望有人可以自己提供一些简单的（Swift）代码来实现此目标，也可以指出一些可以在此项目中实现的不错的库/ SDK的方向。

1 个解决方案

为了实现良好的VAD算法，可以使用py-webrtcvad 。

它是C代码的Python界面，您可以从项目中导入C文件，然后快速使用它们。

首次获取语音的iOS Mic检测失败

[英]IOS Mic detection for getting Voice fails first time IOS7

当我按下其他按钮时，会自动从UITextField激活麦克风按钮（语音输入模式）

[英]Automatically activate mic button (Voice input mode ) from UITextField when I Press other button

无论如何要在iOS的Toxbox中获取麦克风活动/级别

[英]anyway to get the mic activity/level in toxbox on iOS

iOS：Bad Mic输入延迟测量结果

[英]iOS: Bad Mic input latency measurement result

处理iOS麦克风输入并计算频率？（迅速）

[英]Processing iOS mic input and calculate frequency? (Swift)

麦克风输入到iOS设备上的扬声器输出？

[英]Mic input to the speaker output on an iOS device?

iOS输入麦克风输出蓝牙设备

[英]iOS Input Mic Output Bluetooth Device

私有iOS API用于从iPhone上的降噪麦克风访问原始输入？

[英]Private iOS API to access raw input from the noise canceling mic(s) on iPhone?

iOS AudioUnit设置将麦克风输入保存到原始PCM文件

[英]iOS AudioUnit settings to save mic input to raw PCM file

在iOS上插入耳机时，麦克风内置的输入声音较低

[英]Input sound built in mic lower when headphones are plugged on iOS

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 首次获取语音的iOS Mic检测失败当我按下其他按钮时，会自动从UITextField激活麦克风按钮（语音输入模式）无论如何要在iOS的Toxbox中获取麦克风活动/级别 iOS：Bad Mic输入延迟测量结果处理iOS麦克风输入并计算频率？（迅速）麦克风输入到iOS设备上的扬声器输出？ iOS输入麦克风输出蓝牙设备私有iOS API用于从iPhone上的降噪麦克风访问原始输入？ iOS AudioUnit设置将麦克风输入保存到原始PCM文件在iOS上插入耳机时，麦克风内置的输入声音较低

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM