Python音频wav文件分析

Question

我正在开发一个需要 30 分钟的 wav 文件并针对各种事件对其进行分析的程序。 我有一堆 30 分钟的体育赛事 wav 文件，并试图自动化一种查找某些事件发生时间的方法。

例如，以下是我想尝试识别的事件： - 当目标或事件发生时，人群中会出现噪音和欢呼声。 我想返回这些事件发生的时间。 - 或者当哨声响起时 - 也能够识别长时间的完全沉默会有所帮助

我一直在尝试绘制这些音频样本的 FFT 图形，并得出结论，这并不能让我对这些事件有最好的了解。 解决此问题的最佳流程是什么？

任何指导都将不胜感激。

谢谢

Answer 1

希望以下步骤可以帮助到您。

读取WAV文件：
在 Python 中读取 *.wav 文件
Python Wave 字节数据
检测声音：
用python检测并录制声音
使用来自实时麦克风的 pyaudio 检测点击
Python 在检测到的声音上录制音频

确定声音块中的第一个异常点，如：

 sample_rate = 44100 wav_file_duration = 30*60 #in sec. first_abnormal_point_index = 20000

那么声音的开始是：

 onset = first_abnormal_point_index/sample_rate * wav_file_duration

或者您也可以使用其他 python 包来执行此操作，例如Modal或aubio 。