使用Python進行音頻信號處理

Question

我一直在做有關音頻信號處理的作業。 我讀過一些論文，對公式感到困惑： 在此處輸入圖片說明。 該公式用於處理44100Hz，16位單通道音頻。 音頻已經過預處理，並且被切成1024個寬度的幀。 F(w)是每個幀的FFT系數，且w with - above是幀速率22050的一半。

我已經搜索了很多最重要的使用快速傅立葉變換分析音頻的方法。 但是我仍然不清楚。 我有FFT系數，有scipy和numpy，1024寬度數組。 那我該如何計算公式呢？ 它等於數組的0到512個值的總和嗎？

希望有人能幫助我。 提前致謝。

Answer 1

假設您有一個信號x = [ x_1, x_2, ..., x_N ]那么您將在python中計算上述公式（導入scipy）：

E = sum( abs(fft(x))[:len(x)/2]**2 ) / len(x)

關於歸一化因子N = len(x)我不確定100％—這取決於fft的確切實現。

使用Python進行音頻信號處理

問題描述

1 個解決方案

解決方案1
0 已采納 2013-06-11 19:07:11

使用Python進行音頻信號處理

問題描述

1 個解決方案

解決方案1 0 已采納 2013-06-11 19:07:11

解決方案1
0 已采納 2013-06-11 19:07:11