优化浮点除法和转换操作

Question

我有以下公式

float mean = (r+b+g)/3/255.0f;

我想加快速度。 有以下先决条件

0<= mean <= 1  and 0 <= r,g,b <= 255 and r, g, b are unsigned chars

因此，如果我尝试使用>> 8就像除以256的事实，我会使用类似的东西

float mean = (float)(((r+b+g)/3) >> 8);

这将始终返回0.有没有办法跳过昂贵的浮动分区，最终仍然是0到1之间的平均值？

Answer 1

将您的分区预转换为可乘法常量：

a / 3 / 255

是相同的

a * (1 / (3 * 255))

所以预先计算：

const float AVERAGE_SCALE_FACTOR = 1.f / (3.f * 255.f)

然后就做

float mean = (r + g + b) * AVERAGE_SCALE_FACTOR;

因为乘法通常比分割快很多。

Answer 2

你明显将平均值与其他东西进行比较，也就是在0和1之间。你怎么把这个东西乘以255呢？

Answer 3

让我们看看真正的编译器实际上用这个代码做了什么？ 我喜欢mingw gcc 4.3（x86）。 我用过“gcc test.c -O2 -S -c -Wall”

这个功能：

float calc_mean(unsigned char r, unsigned char g, unsigned char b)
{
    return (r+b+g)/3/255.0f;
}

生成此对象代码（为了清楚起见，删除了函数入口和退出代码。我希望我添加的注释大致正确）：

movzbl 12(%ebp), %edx    ; edx = g
 movzbl 8(%ebp), %eax     ; eax = r
 addl %eax, %edx        ; edx = eax + edx
 movzbl 16(%ebp), %eax    ; eax = b
 addl %eax, %edx        ; edx = eax + edx
 movl $1431655766, %eax ; 
 imull %edx              ; edx *= a const
 flds LC0               ; put a const in the floating point reg
 pushl %edx              ; put edx on the stack
 fidivrl (%esp)            ; float reg /= top of stack

而这个功能：

float calc_mean2(unsigned char r, unsigned char g, unsigned char b)
{
    const float AVERAGE_SCALE_FACTOR = 1.f / (3.f * 255.f);
    return (r+b+g) * AVERAGE_SCALE_FACTOR;
}

生成这个：

movzbl 12(%ebp), %eax    
 movzbl 8(%ebp), %edx
 addl %edx, %eax
 movzbl 16(%ebp), %edx
 addl %edx, %eax
 flds LC2
 pushl %eax
 fimull (%esp)

如您所见，第二个功能更好。 使用-freciprocal-math进行编译会将fidivrl从第一个函数转换为fimull，这应该是一个改进。 但第二个功能仍然更好。

但是，如果您认为现代桌面CPU具有类似18级流水线的功能并且每个周期能够执行其中几条指令，您可以看到这些功能的性能将由于数据依赖性而受到停顿的支配。 希望你的程序有这个代码片段内联并且有一些循环展开。

考虑到隔离的这种小代码片段并不理想。 这有点像用双筒望远镜粘在眼窝上驾驶汽车。 缩小男人！

Answer 4

如Andrew所示，原始功能根本没有优化。 编译器不能，因为您首先将总和除以整数，然后除以浮点数。 这与乘以上述平均比例因子不同。 如果你将（r + g + b）/3/255.0f改为（r + g + b）/3.0f/255.0f，编译器可能会优化它以自动使用fimull。

Answer 5

为平台优化此类操作是非常常见的，而不是作为算法或可移植的C. 虚拟配音博客非常值得阅读有关如何在针对x86和x64架构的软件中完成的提示，并且有几个关于优化像素平均值的条目1 2 。

优化浮点除法和转换操作

问题描述

5 个解决方案

解决方案1
16 已采纳 2009-09-02 08:32:56

解决方案2
8 2009-09-02 08:29:13

解决方案3
5 2009-09-02 17:39:59

解决方案4
1

解决方案5
1 2009-09-03 08:52:02

优化浮点除法和转换操​​作

问题描述

5 个解决方案

解决方案1 16 已采纳 2009-09-02 08:32:56

解决方案2 8 2009-09-02 08:29:13

解决方案3 5 2009-09-02 17:39:59

解决方案4 1

解决方案5 1 2009-09-03 08:52:02

优化浮点除法和转换操作

解决方案1
16 已采纳 2009-09-02 08:32:56

解决方案2
8 2009-09-02 08:29:13

解决方案3
5 2009-09-02 17:39:59

解决方案4
1

解决方案5
1 2009-09-03 08:52:02