繁体   English   中英

将音频样本从时域转换为频域

[英]Transforming Audio Samples From Time Domain to Frequency Domain

作为一名软件工程师,我在处理信号处理问题时遇到了一些困难。 我在这个领域没有多少经验。

我尝试做的是采用44100采样率对环境声音进行采样,并对固定尺寸的窗口进行采样,以测试是否存在特定频率(20KHz)且高于阈值。

根据如何使用C中的FFTW从PortAudio中提取样本中的频率信息,我将按照完美的答案执行此操作

从音频端口收集102400个样本(2320 ms),采样率为44100。 样本值介于0.0和1.0之间

int samplingRate = 44100;
int numberOfSamples = 102400;
float samples[numberOfSamples] = ListenMic_Function(numberOfSamples,samplingRate);

窗口大小或FFT大小为1024个样本(23.2 ms)

int N = 1024;

窗口数是100

int noOfWindows = numberOfSamples / N;

将样本拆分到noOfWindows(100)窗口,每个窗口的大小为N(1024)个样本

float windowSamplesIn[noOfWindows][N];
for i:= 0 to noOfWindows -1 
    windowSamplesIn[i] = subarray(samples,i*N,(i+1)*N);
endfor

在每个窗口上应用汉宁窗函数

float windowSamplesOut[noOfWindows][N];
for i:= 0 to noOfWindows -1 
    windowSamplesOut[i] = HanningWindow_Function(windowSamplesIn[i]);
endfor

在每个窗口上应用FFT(在FFT函数内完成复数转换)

float frequencyData[noOfWindows][samplingRate/2]; 
for i:= 0 to noOfWindows -1 
    frequencyData[i] = RealToComplex_FFT_Function(windowSamplesOut[i], samplingRate);
endfor

在最后一步中,我使用此链接中实现的FFT函数: http//www.codeproject.com/Articles/9388/How-to-implement-the-FFT-algorithm ; 因为我无法从头开始实现FFT功能。

我不能确定的是,当给FFT输入N(1024)个样本时,samplingRate / 2(22050)分贝值作为输出返回。 这是一个FFT功能吗?

据我所知,由于奈奎斯特频率,我最多可以检测到一半的采样率频率。 但是,每个频率的分贝值是否可以达到samplingRate / 2(22050)Hz?

谢谢,Vahit

请参阅如何获取FFT中每个值的频率?

从1024个样本输入,您可以获得512个有意义的频率级别。

所以,是的,在你的窗口内,你将获得奈奎斯特频率的水平。

您将看到的最低频率级别是DC(0 Hz),下一个将是SampleRate / 1024,或大约44 Hz,下一个是2 * SampleRate / 1024,依此类推,最多512 * * SampleRate / 1024 Hz。

由于您的FFT中只使用了一个波段,因此即使使用适当的窗口,我也希望您的结果会受到边带效应的影响。 它可能会起作用,但您可能也会因某些输入频率而出现误报。 此外,您的信号接近您的信号,因此您假设信号路径相当于您的FFT。 我不认为这是正确的方法。

我认为这种信号检测的更好方法是使用高阶滤波器(根据您的要求,我会猜测四阶或五阶,实际上并不高)。 如果您不知道如何设计高阶滤波器,可以使用两个或三个二阶滤波器串联。 这里描述了设计二阶滤波器,有时称为“双二阶”:

http://www.musicdsp.org/files/Audio-EQ-Cookbook.txt

虽然非常简洁,但有一些先验知识的假设。 我会使用一个高通(HP)滤波器,其转角频率尽可能低,可能在18到20 kHz之间。 请记住,在转角频率处有一些衰减,因此在多次应用滤波器后,您将丢弃一个小信号。

过滤音频后,取RMS或平均幅度(即绝对值的平均值),以查找一段时间内的平均水平。

这种技术比你现在所做的有几个优点,包括更好的延迟(你可以在几个样本中开始检测),更好的可靠性(你不会得到假阳性以响应杂散频率的大声信号),等等。

这篇文章可能具有相关性: http//blog.bjornroche.com/2012/08/why-eq-is-done-in-time-domain.html

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM