繁体 English 中英

为什么优化标志（-O3）不能加快四倍精度计算？

[英]Why optimization flag (-O3) doesn't speed up quadruple precision calculations?

原文 2015-06-26 07:34:40 7 3 c++/ compiler-optimization/ floating-point-precision/ quadruple-precision

我有一个用C ++编写的高精度ODE（常微分方程）求解器。 我使用用户定义的类型real_type进行所有计算。 在标头中有一个typedef声明此类型：

typedef long double real_type;

我决定将long double类型更改为__float128以提高准确性。 除此之外，我还包含了quadmath.h并用quadmath.h函数替换了所有标准数学函数。

如果构建的“ long double”版本没有任何优化标志，则一些参考ODE将在77秒内解决。 如果使用-O3标志构建此版本，则相同的ODE将在25秒内解决。 因此，-O3标志可将计算速度提高三倍。

但是在不带标志的“ __float 128”版本中，类似的ODE可以在190秒内解决，而使用-O3可以在160秒内解决（差异约为15％）。 为什么-O3优化对四倍精度计算的影响如此之弱？ 也许我应该使用其他编译器标志或包括其他库？

3 个解决方案

编译器优化的工作方式如下：编译器识别代码中的某些模式，并用等效但速度更快的版本替换它们。 在不完全了解您的代码是什么样的情况以及编译器执行了哪些优化的情况下，我们无法说出缺少的编译器。

编译器很可能知道如何对本机浮点类型及其操作执行一些优化，而不知道对__float128和操作的库实现执行。 它可能无法识别这些操作的实质。 也许它无法查看库的实现（您应该尝试将库与程序一起编译并启用链接时优化）。

相同的优化提供了基本相同的好处。 百分比下降只是因为数学本身花费了更长的时间。

要相信优化应该是相同的百分比，您必须相信使数学花费更长的时间会以某种方式使优化器发现更多的节省。 你为什么那么想？

如果您的目标是x86体系结构，则在GCC中__float128是实际的四精度FP类型，而long double是x87 96位FP类型（double扩展）。

具有较小精度类型的数学可以比具有较大精度类型的数学更快，这是合理的。 用本地硬件类型进行数学运算要比使用非本地类型进行数学运算更快也是合理的。

std :: ofstrean不适用于-O3

[英]std::ofstrean doesn't work with -O3

g++ 优化：O2 标志修复了 O3 再次破坏的损坏代码

[英]g++ Optimization : O2 flag fixes a broken code where O3 breaks it again

gcc优化标志-O3使代码比-O2慢

[英]gcc optimization flag -O3 makes code slower than -O2

-O3循环增量优化

[英]-O3 loop increment optimization

GCC：程序不适用于编译选项-O3

[英]GCC: program doesn't work with compilation option -O3

关于gcc O3优化标志的疑问

[英]Doubts about gcc O3 optimisation flag

超出-O3 / -Ofast的G ++优化

[英]G++ optimization beyond -O3/-Ofast

Qt项目的Netbeans“ -O3”优化

[英]Netbeans “-O3” optimization for Qt projects

为什么clang -O3会出现这种行为？

[英]Why this behavior on clang -O3?

使用-O2或-O3标志编译时未捕获到异常

[英]Exception not caught when compiled with -O2 or -O3 flag

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 std :: ofstrean不适用于-O3 g++ 优化：O2 标志修复了 O3 再次破坏的损坏代码 gcc优化标志-O3使代码比-O2慢 -O3循环增量优化 GCC：程序不适用于编译选项-O3 关于gcc O3优化标志的疑问超出-O3 / -Ofast的G ++优化 Qt项目的Netbeans“ -O3”优化为什么clang -O3会出现这种行为？使用-O2或-O3标志编译时未捕获到异常

相关标签

为什么优化标志（-O3）不能加快四倍精度计算？

问题描述

3 个解决方案

解决方案1
2 已采纳 2015-06-26 08:00:22

解决方案2
0 2015-06-26 07:47:06

解决方案3
0 2015-06-26 07:47:25

为什么优化标志（-O3）不能加快四倍精度计算？

问题描述

3 个解决方案

解决方案1 2 已采纳 2015-06-26 08:00:22

解决方案2 0 2015-06-26 07:47:06

解决方案3 0 2015-06-26 07:47:25

解决方案1
2 已采纳 2015-06-26 08:00:22

解决方案2
0 2015-06-26 07:47:06

解决方案3
0 2015-06-26 07:47:25