如何在python中找到wav文件的幅度？

Question

我正在使用 python 中的 librosa 库进行 wav 文件分析。 我使用librosa.load()加载音频文件。 显然，这个函数将 wav 文件加载到一个 numpy 数组中，归一化幅度值在 -1 到 1 的范围内。但我需要获取实际的幅度值进行处理。 我怎样才能找到那个？

提前致谢！

Answer 1

您正确地观察到librosa始终将样本标准化为单声道[-1:1] （以及 22050 Hz）。 也就是说，它是数字音频，所以可以乘以任何你想要获得不同音阶的东西。 如果您坚持认为您的样本在-2^15到2^15 ，只需乘以2^15 。 这几乎意味着相同。

除了将编码音频格式的特殊性拖入您的数据之外，您将一无所获。

也就是说，如果这就是你想要的，你可以像这样使用PySoundFile ：

import soundfile as sf

y, sr = sf.read('existing_file.wav', dtype='int16')

参数dtype='int16'告诉库假设每个样本采用带符号的 16 位格式。

Answer 2

你不能。 正如 Hendrik 所提到的，信号是数字的，WAV 文件中的幅度不会告诉您有关实际声波幅度/声功率的任何信息。 在将其数字化为 WAV 的那一刻，这完全消失了。

话虽如此，您可以计算例如响度，声功率的相对感知。 如果您正在处理人类听觉系统，推荐的方法之一是：

使用 Bark 音阶（Bark 音阶更好地反映我们的听力）。
计算每个 bin 中的能量。
（可选）按总和归一化。

如果您不想自己计算，请查看例如YAAFE 。

如何在python中找到wav文件的幅度？

问题描述

2 个解决方案

解决方案1
2 2021-07-10 10:50:48

解决方案2
1 已采纳 2021-07-10 17:14:16

如何在python中找到wav文件的幅度？

问题描述

2 个解决方案

解决方案1 2 2021-07-10 10:50:48

解决方案2 1 已采纳 2021-07-10 17:14:16

解决方案1
2 2021-07-10 10:50:48

解决方案2
1 已采纳 2021-07-10 17:14:16