Scipy 頻譜圖與多個 Numpy FFT 的對比

Question

我正在嘗試優化我給出的一些代碼，其中 FFT 取自時間序列上的滑動窗口（作為列表給出），並且每個結果都累積到一個列表中。 原代碼如下：

def calc_old(raw_data):
    FFT_old = list()

    for i in range(0, len(raw_data), bf.WINDOW_STRIDE_LEN):
        if (i + bf.WINDOW_LEN) >= len(raw_data):
            # Skip the windows that would extend beyond the end of the data
            continue

        data_tmp = raw_data[i:i+bf.WINDOW_LEN]
        data_tmp -= np.mean(data_tmp)
        data_tmp = np.multiply(data_tmp, np.hanning(len(data_tmp)))
        fft_data_tmp = np.fft.fft(data_tmp, n=ZERO_PAD_LEN)
        fft_data_tmp = abs(fft_data_tmp[:int(len(fft_data_tmp)/2)])**2
        FFT_old.append(fft_data_tmp)

和新代碼：

def calc_new(raw_data):
    data = np.array(raw_data)  # Required as the data is being handed in as a list
    f, t, FFT_new = spectrogram(data,
                                fs=60.0,
                                window="hann",
                                nperseg=bf.WINDOW_LEN,
                                noverlap=bf.WINDOW_OVERLAP,
                                nfft=bf.ZERO_PAD_LEN,
                                scaling='spectrum')

總之，舊代碼對時間序列加窗，去除均值，應用 Hann 加窗函數，取 FFT（補零時，如ZERO_PAD_LEN>WINDOW_LEN ），然后取實數一半的絕對值並將其平方為產生功率譜（單位 V**2）。 然后它通過WINDOW_STRIDE_LEN移動窗口，並重復該過程，直到窗口超出數據的末尾。 這與WINDOW_OVERLAP重疊。

據我所知，頻譜圖應該對我給出的參數做同樣的事情。 然而，FFT 的結果維度對於每個軸相差 1（例如，舊代碼是 MxN，新代碼是 (M+1)x(N+1)）並且每個頻率倉中的值大不相同——幾個階在某些情況下，數量級。

我在這里缺少什么？

Answer 1

縮放

在實施calc_old使用從輸出np.fft.fft直接沒有任何縮放。

另一方面，實現calc_new使用scipy.signal.spectrogram ，它最終使用np.fft.rfft但也根據接收到的scaling和return_onesided參數scaling結果。 進一步來說：

對於默認的return_onesided=True （因為您沒有在calc_new提供明確的值），每個 bin 的值都會加倍以計算包括對稱 bin 在內的總能量。
對於提供的scaling='spectrum' ，這些值進一步按因子1.0/win.sum()**2縮放。 對於選定的 Hann 窗口，對應於4/N**2 ，其中N=bf.WINDOW_LEN是窗口長度。

因此，您可能期望新實現cald_new為您提供與calc_old相比按8/bf.WINDOW_LEN**2的總因子縮放的結果。 或者，如果您希望第二個實現與calc_old具有相同的縮放比例，則應將scipy.signal.spectrogram的結果乘以0.125 * bf.WINDOW_LEN**2 。

頻率倉的數量

給定偶數個點nperseg ，您的初始實現calc_old僅保留nperseg//2頻率箱。

另一方面，完整的非冗余半頻譜應該為您提供nperseg//2 + 1頻率倉（有具有相應對稱性的nperseg-2倉，加上 0Hz 和奈奎斯特速率下的 2 個非對稱倉，因此保留非冗余部分留給你(nperseg-2)//2 + 2 == nperseg//2 + 1 )。 這就是scipy.signal.spectrogram返回的內容。

換句話說，您的初始實現calc_old缺少奈奎斯特頻率倉。

時間步數

如果最后一個時間步計算bf.WINDOW_LEN樣本少於bf.WINDOW_LEN ，則calc_old的實現calc_old跳過最后一個時間步。 只有當len(raw_data)-bf.WINDOW_STRIDE_LEN是len(raw_data)-bf.WINDOW_STRIDE_LEN的精確倍數時， bf.WINDOW_LEN跳過這些樣本。 我猜您的特定輸入序列並非如此。

相反，如果需要， scipy.signal.spectrogram用額外的樣本scipy.signal.spectrogram數據，以便在頻譜圖計算期間使用所有輸入樣本，並且與您的calc_old實現相比，這可能會導致一個額外的時間步calc_old 。

Answer 2

可能有人知道原因，為什么在將頻譜圖結果與手動 FFT 進行比較時會出現一些差異？

# Parametrs of signal and its preprocessing
sample_rate = 4
window_size = 512 * sample_rate
detrend = 'linear'
tukey_alpha = 0.25
[![enter image description here][1]][1]
# Spectrogram
f, t, S = scipy.signal.spectrogram(signal, sample_rate, nperseg=window_size, noverlap=sample_rate, scaling='spectrum', mode='magnitude', detrend=detrend)

# FFT on the leftmost window of signal
windowed_signal = signal[:window_size]
windowed_signal = scipy.signal.detrend(windowed_signal, type=detrend)
windowed_signal *= scipy.signal.windows.tukey(window_size, tukey_alpha)
A = np.fft.rfft(windowed_signal)
freqs = np.fft.rfftfreq(window_size) * sample_rate
positive_freqs_n = int(np.ceil(window_size / 2.))
freqs_slice = slice(0, positive_freqs_n)
magnitudes = np.abs(A)[freqs_slice] / window_size

# Plotting
plt.plot(f, S.T[0], label='First window from scipy.signal.spectrogram')
plt.plot(freqs[freqs_slice], magnitudes, alpha=0.5, label='np.fft on first window')
plt.yscale('log')
plt.xscale('log')
plt.legend()
plt.xlabel('Frequency, Hz')
plt.ylabel('Magnitude')

這種小的縱向分歧可能來自哪里？ 謝謝！

Scipy 頻譜圖與多個 Numpy FFT 的對比

問題描述

2 個解決方案

解決方案1
5 已采納 2018-08-18 03:45:59

解決方案2
0 2020-05-21 09:09:59

Scipy 頻譜圖與多個 Numpy FFT 的對比

問題描述

2 個解決方案

解決方案1 5 已采納 2018-08-18 03:45:59

解決方案2 0 2020-05-21 09:09:59

解決方案1
5 已采納 2018-08-18 03:45:59

解決方案2
0 2020-05-21 09:09:59