[英]Scaling an image according to audio (threshold, frequencies)
我正在寻找根据提供的音频、频率范围(例如 20hz-1000hz)和阈值缩放 PNG 文件,以获得平滑的效果。 例如,当有脚踢时,比例平滑地达到 120%,我想让那些音频可视化器,如 dubstep 等......当脚踢进来时,他们的图像是“泵”的。 首先,它可以用ffmpeg吗? 从哪儿开始? 我发现showcqt在输入等中采用频率,但它的输出是视频,所以我认为我不能在我的情况下使用它。 任何帮助表示赞赏。
如果您能够在输出 PCM 值时读取它们,那么您可以考虑使用滚动 RMS 平均值以获得连续的幅度流。 IDK 数组的最佳长度。 也许它应该对应于可以为每个视觉帧提供更新的音频帧数? DSP 网站上的人将有最好的见解。
如果你做一个滚动平均,计算并不是非常昂贵。 您将对传入进行平方并将其添加到环形缓冲区(循环队列)并丢弃传出。 在计算新的滚动平均值时,只需将这些数据点添加到滚动平均值中,因为分母是固定的且已知的。 我在这里找到了一个使用 Matlab 描述基本 RMS 数学的视频。
可能有必要为接收卷更新的可视化器添加一些平滑。 此外,从音频线程传递数据可能会采用某种形式的松散耦合。 如果处理音频的线程也处理图形,那就不好了。
我有点过头了,但我认为这是通常为可视化者所做的。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.