Double vs Float vs _Float16（运行时间）

Question

我有一个 C 语言的简单问题。 我正在使用 C 中的 _Float16 实现半精度软件（我的 mac 基于 ARM），但运行时间并不比单精度或双精度软件快。 我用一个非常简单的代码测试了一半，单，双，就像只是添加数字一样。 一半的速度比单人或双人的慢。 此外，single 类似于 double。

typedef double FP;
// double - double precision
// float - single precision
// _Float16 - half precision
int main(int argc, const char * argv[]) {

    float time;
    clock_t start1, end1;
    start1 = clock();

    int i;
    FP temp = 0;

    for(i = 0; i< 100; i++){
        temp = temp + i;
    }
    end1 = clock();
    time = (double)(end1 - start1)/CLOCKS_PER_SEC;

    printf("[] %.16f\n", time);
    return 0;
}

在我的预期中，半精度比单精度或双精度要快得多。 如何检查半精度更快，浮点数比双精度更快？

请帮我。

Answer 1

这是关于浮点的一个非常令人惊讶的事实：

单精度 ( float ) 算术不一定比双精度快。

怎么会这样？ 浮点运算很难，所以以两倍的精度来做至少两倍的难度，而且必须花费更长的时间，对吧？

嗯，不。 是的，以更高的精度进行计算需要更多的工作，但只要工作是由专用硬件（通过某种浮点单元或 FPU）完成的，一切都可能并行发生。 双精度的难度可能会增加一倍，因此专用于它的晶体管数量可能会增加一倍，但不会再花更多的时间了。

事实上，如果您的系统具有同时支持单精度和双精度浮点的 FPU，那么一个好的规则是：始终使用double 。 这条规则的原因是float类型通常不够准确。 所以如果你总是使用double ，你会经常避免数字不准确（如果你使用float ，那会杀了你），但它不会变慢。

现在，到目前为止，我所说的一切都假定您的 FPU确实支持您关心的硬件类型。 如果存在硬件不支持的浮点类型，如果必须在软件中进行模拟，那么它显然会更慢，通常会慢得多。 这种影响至少体现在三个方面：

如果您使用的是完全没有 FPU 的微控制器，那么所有浮点都在软件中实现是很常见的，而且速度非常慢。 （我认为双精度更慢也是很常见的，这意味着float在那里可能是有利的。）
如果您使用的是非标准或低于标准的类型，由于这个原因是在软件中实现的，它显然会更慢。 特别是：我熟悉的 FPU 不支持半精度（16 位）浮点类型，所以是的，如果它比常规float或double慢得多也就不足为奇了。
一些 GPU 对单精度或半精度有很好的支持，但对双精度的支持很差或不支持。

Answer 2

我已将代码的相关部分提取到 C++ 中，以便可以轻松地为每种类型实例化它：

template<typename T>
T calc() {
    T sum = 0;
    for (int i = 0; i < 100; i++) {
        sum += i;
    }
    return sum;
}

在 Clang 中使用优化 ( -O3 ) 编译它并查看Godbolt上的程序集列表表明：

double版本在内循环中的指令数量最少（4）
float版本的内循环有 5 条指令，看起来和double version基本不相上下
_Float16版本在内循环中有 9 条指令，因此可能是最慢的。 额外的指令是在fcvt和 float32 格式之间转换的 fcvt。

请注意，计数指令只是性能的粗略指南！ 例如，有些指令需要多个周期才能执行，而流水线执行意味着可以并行执行多条指令。

Clang 的语言扩展文档表明_Float16在 ARMv8.2a 上受支持，而 M1 似乎是 v8.4，所以大概它也支持这一点。 不过，我不确定如何在 Godbolt 中启用此功能，抱歉！

我会使用clock_gettime(CLOCK_MONOTONIC)在Linux 下进行高精度（即纳秒）计时。 OSX 似乎没有提供此功能，但在 OSX 上似乎可以使用 Monotonic clock替代方案。

Double vs Float vs _Float16（运行时间）

问题描述

2 个解决方案

解决方案1
1 2022-07-09 21:47:49

解决方案2
0 2022-07-11 18:54:39

Double vs Float vs _Float16（运行时间）

问题描述

2 个解决方案

解决方案1 1 2022-07-09 21:47:49

解决方案2 0 2022-07-11 18:54:39

解决方案1
1 2022-07-09 21:47:49

解决方案2
0 2022-07-11 18:54:39