如何优化 C++ 中的简单数字类型包装器 class？

Question

我正在尝试在 C++ 中实现定点 class，但我遇到了性能问题。 我已将问题简化为浮点类型的简单包装器，但它仍然很慢。 我的问题是 - 为什么编译器无法完全优化它？

“浮动”版本比“浮动”版本快 50%。 为什么？！

（我使用 Visual C++ 2008，所有可能的编译器选项都经过测试，当然是发布配置）。

请看下面的代码：

#include <cstdio>
#include <cstdlib>
#include "Clock.h"      // just for measuring time

#define real Float      // Option 1
//#define real float        // Option 2

struct Float
{
private:
    float value;

public:
    Float(float value) : value(value) {}
    operator float() { return value; }

    Float& operator=(const Float& rhs)
    {
        value = rhs.value;
        return *this;
    }

    Float operator+ (const Float& rhs) const
    {
        return Float( value + rhs.value );
    }

    Float operator- (const Float& rhs) const
    {
        return Float( value - rhs.value );
    }

    Float operator* (const Float& rhs) const
    {
        return Float( value * rhs.value );
    }

    bool operator< (const Float& rhs) const
    {
        return value < rhs.value;
    }
};

struct Point
{
    Point() : x(0), y(0) {}
    Point(real x, real y) : x(x), y(y) {}

    real x;
    real y;
};

int main()
{
    // Generate data
    const int N = 30000;
    Point points[N];
    for (int i = 0; i < N; ++i)
    {
        points[i].x = (real)(640.0f * rand() / RAND_MAX);
        points[i].y = (real)(640.0f * rand() / RAND_MAX);
    }

    real limit( 20 * 20 );

    // Check how many pairs of points are closer than 20
    Clock clk;

    int count = 0;
    for (int i = 0; i < N; ++i)
    {
        for (int j = i + 1; j < N; ++j)
        {
            real dx = points[i].x - points[j].x;
            real dy = points[i].y - points[j].y;
            real d2 = dx * dx + dy * dy;
            if ( d2 < limit )
            {
                count++;
            }
        }
    }

    double time = clk.time();

    printf("%d\n", count);
    printf("TIME: %lf\n", time);

    return 0;
}

Answer 1

IMO，它与优化标志有关。 我在 g++ linux-64 机器上检查了你的程序。 没有任何优化，它给出的结果与您所说的减少50%相同。

保持最大优化开启（即-O4 ）。 两个版本都是一样的。 打开优化并检查。

Answer 2

尽量不要通过引用传递。 您的 class 足够小，以至于通过引用传递它的开销（是的，如果编译器不对其进行优化，则会产生开销），可能高于仅复制 class。 所以这...

Float operator+ (const Float& rhs) const
{
   return Float( value + rhs.value );
}

变成这样……

Float operator+ (Float rhs) const
{
   rhs.value+=value;
   return rhs;
}

这避免了临时 object 并且可以避免指针取消引用的某些间接。

Answer 3

经过进一步调查，我完全确信这是编译器优化管道的问题。 与使用非封装float相比，在这种情况下生成的代码非常糟糕。 我的建议是将这个潜在问题报告给微软，看看他们对此有何看法。 我还建议您继续实施此 class 的计划定点版本，因为为整数生成的代码似乎是最佳的。

如何优化 C++ 中的简单数字类型包装器 class？

问题描述

3 个解决方案

解决方案1
4 已采纳 2011-07-19 09:12:27

解决方案2
4 2011-07-19 09:25:32

解决方案3
2 2011-07-19 09:15:55

如何优化 C++ 中的简单数字类型包装器 class？

问题描述

3 个解决方案

解决方案1 4 已采纳 2011-07-19 09:12:27

解决方案2 4 2011-07-19 09:25:32

解决方案3 2 2011-07-19 09:15:55

解决方案1
4 已采纳 2011-07-19 09:12:27

解决方案2
4 2011-07-19 09:25:32

解决方案3
2 2011-07-19 09:15:55