繁体   English   中英

Python音频wav文件分析

[英]Python audio wav file analysis

我正在开发一个需要 30 分钟的 wav 文件并针对各种事件对其进行分析的程序。 我有一堆 30 分钟的体育赛事 wav 文件,并试图自动化一种查找某些事件发生时间的方法。

例如,以下是我想尝试识别的事件: - 当目标或事件发生时,人群中会出现噪音和欢呼声。 我想返回这些事件发生的时间。 - 或者当哨声响起时 - 也能够识别长时间的完全沉默会有所帮助

我一直在尝试绘制这些音频样本的 FFT 图形,并得出结论,这并不能让我对这些事件有最好的了解。 解决此问题的最佳流程是什么?

任何指导都将不胜感激。

谢谢

希望以下步骤可以帮助到您。

  1. 读取WAV文件:

    在 Python 中读取 *.wav 文件

    Python Wave 字节数据

  2. 检测声音:

    用python检测并录制声音

    使用来自实时麦克风的 pyaudio 检测点击

    Python 在检测到的声音上录制音频

  3. 确定声音块中的第一个异常点,如:

     sample_rate = 44100 wav_file_duration = 30*60 #in sec. first_abnormal_point_index = 20000

    那么声音的开始是:

     onset = first_abnormal_point_index/sample_rate * wav_file_duration

或者您也可以使用其他 python 包来执行此操作,例如Modalaubio

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM