繁体   English   中英

根据音频(阈值、频率)缩放图像

[英]Scaling an image according to audio (threshold, frequencies)

我正在寻找根据提供的音频、频率范围(例如 20hz-1000hz)和阈值缩放 PNG 文件,以获得平滑的效果。 例如,当有脚踢时,比例平滑地达到 120%,我想让那些音频可视化器,如 dubstep 等......当脚踢进来时,他们的图像是“泵”的。 首先,它可以用ffmpeg吗? 从哪儿开始? 我发现showcqt在输入等中采用频率,但它的输出是视频,所以我认为我不能在我的情况下使用它。 任何帮助表示赞赏。

如果您能够在输出 PCM 值时读取它们,那么您可以考虑使用滚动 RMS 平均值以获得连续的幅度流。 IDK 数组的最佳长度。 也许它应该对应于可以为每个视觉帧提供更新的音频帧数? DSP 网站上的人将有最好的见解。

如果你做一个滚动平均,计算并不是非常昂贵。 您将对传入进行平方并将其添加到环形缓冲区(循环队列)并丢弃传出。 在计算新的滚动平均值时,只需将这些数据点添加到滚动平均值中,因为分母是固定的且已知的。 我在这里找到了一个使用 Matlab 描述基本 RMS 数学的视频。

可能有必要为接收卷更新的可视化器添加一些平滑。 此外,从音频线程传递数据可能会采用某种形式的松散耦合。 如果处理音频的线程也处理图形,那就不好了。

我有点过头了,但我认为这是通常为可视化者所做的。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM