簡體   English   中英

使用Python進行音頻信號處理

[英]Audio signal processing using Python

我一直在做有關音頻信號處理的作業。 我讀過一些論文,對公式感到困惑: 在此處輸入圖片說明 該公式用於處理44100Hz,16位單通道音頻。 音頻已經過預處理,並且被切成1024個寬度的幀。 F(w)是每個幀的FFT系數,且w with - above是幀速率22050的一半。

我已經搜索了很多最重要的使用快速傅立葉變換分析音頻的方法 但是我仍然不清楚。 我有FFT系數,有scipy和numpy,1024寬度數組。 那我該如何計算公式呢? 它等於數組的0到512個值的總和嗎?

希望有人能幫助我。 提前致謝。

假設您有一個信號x = [ x_1, x_2, ..., x_N ]那么您將在python中計算上述公式(導入scipy):

E = sum( abs(fft(x))[:len(x)/2]**2 ) / len(x)

關於歸一化因子N = len(x)我不確定100%—這取決於fft的確切實現。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM