[英]Plotting FFT frequencies in Hz in Python
我正在实施本文中的方法: https : //dspace.mit.edu/bitstream/handle/1721.1/66243/Picard_Noncontact%20Automated.pdf?sequence=1&isAllowed=y
主要思想是使用来自 10 秒视频的一组帧 (N=300) 进行心脏脉搏测量,因此帧速率等于 30 fps。
red = [item[:,:,0] for item in imgs]
green = [item[:,:,1] for item in imgs]
blue = [item[:,:,2] for item in imgs]
red_avg = [item.mean() for item in red]
green_avg = [item.mean() for item in green]
blue_avg = [item.mean() for item in blue]
red_mean, red_std = np.array(red_avg).mean(), np.array(red_avg).std()
green_mean, green_std = np.array(green_avg).mean(), np.array(green_avg).std()
blue_mean, blue_std = np.array(blue_avg).mean(), np.array(blue_avg).std()
red_avg = [(item - red_mean)/red_std for item in red_avg]
green_avg = [(item - green_mean)/green_std for item in green_avg]
blue_avg = [(item - blue_mean)/blue_std for item in blue_avg]
data = np.vstack([signal.detrend(red_avg), signal.detrend(green_avg), signal.detrend(blue_avg)]).reshape(300,3)
from sklearn.decomposition import FastICA
transformer = FastICA(n_components=3)
X_transformed = transformer.fit_transform(data)
from scipy.fftpack import fft
first = X_transformed.T[0]
second = X_transformed.T[1]
third = X_transformed.T[2]
ff = np.fft.fft(first)
fs = np.fft.fft(second)
ft = np.fft.fft(third)
imgs
- 是具有 300 个图像像素值的数组的初始列表。 如您所见,我将所有帧拆分为 RGB 通道,因此具有轨迹x_i(t)
,其中i = 1,2,3
标准化后,我们去除所有轨迹并将它们堆叠起来以进一步应用 ICA,然后对所有三个分量进行 FFT。
然后该方法声称我们需要绘制功率与频率 (Hz) 的关系图并选择最有可能是心脏脉搏的分量。
最后,我们对选定的源信号应用快速傅立叶变换 (FFT) 以获得功率谱。 脉冲频率被指定为对应于操作频带内频谱的最高功率的频率。 在我们的实验中,我们将操作范围设置为 [0.75, 4] Hz(对应于 [45, 240] bpm)以提供广泛的心率测量值。
这是我尝试可视化频率的方法:
import numpy as np
import matplotlib.pyplot as plt
from scipy import signal
data = ft
print(fs.size)
ps = np.abs(np.fft.fft(data))**2
sampling_rate = 30
freqs = np.fft.fftfreq(data.size, 1/sampling_rate)
idx = np.argsort(freqs)
#print(idx)
plt.plot(freqs[idx], ps[idx])
我得到的完全不同,因为频率范围从 $-15$ 到 $15$,我不知道这是否以 Hz 为单位。
上面三张图片是我执行代码以可视化频率和信号功率时得到的结果。
我将不胜感激任何帮助或建议。
您应该真正学习如何将图像/视频作为 nD-张量使用。 这样做你可以用更简洁的代码替换所有的数据争吵:
import numpy as np
import matplotlib.pyplot as plt
from scipy.fftpack import fft
from sklearn.decomposition import FastICA
images = [np.random.rand(640, 480, 3) for _ in range(30)]
# Create tensor with all images
images = np.array(images)
images.shape
# Take average of all pixels, for each image and each channel individually
avgs = np.mean(images, axis=(1, 2))
mean, std = np.mean(avgs), np.std(avgs)
# Normalize all average channels
avgs = (avgs - mean) / std
# Detrend across images
avgs = scipy.signal.detrend(avgs, axis=0)
transformer = FastICA(n_components=3)
X_transformed = transformer.fit_transform(avgs)
X_ff = np.fft.fft(X_transformed, axis=0)
plt.plot(np.abs(X_ff) ** 2)
稍微回答您的问题:我认为您错误地采用了第三个 PCA 分量的傅立叶频谱的傅立叶频谱。
FFT(FFT(PCA[:, 2]))
虽然您打算只进行一次 FFT:
FFT(PCA[:, 2]))
关于 -15...15 轴:您已将采样频率设置为 30Hz(或视频术语中的 30fps)。 这意味着您可以检测视频中高达 15Hz 的任何内容。
在傅立叶理论中,存在一种叫做“负频率”的东西。 现在,由于我们主要分析真实信号(与复杂信号相反),负频率始终与正频率相同。 这意味着您的频谱始终是对称的,您可以忽略左半部分。
但是,由于您进行了两次 FFT,因此您正在查看复数信号的 FFT,该信号确实具有负频率。 这就是为什么您的光谱不对称且令人困惑的原因。
此外,我相信您将重塑和移调混淆了。 在 PCA 之前,您正在组装数据,例如
np.vstack([red, green, blue]) # shape = (3, 300)
您想要转置以获得(300, 3)
。 如果您改用整形,则不会交换行和列,而是以不同的形状解释相同的数据。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.