繁体 English 中英

关于浮点运算

[英]about floating point operation

原文 2012-08-01 19:31:09 7 1 cuda/ gpgpu

最近，我一直在使用CUDA开发环境制作程序（FDTD Operation），OS是Windows server 2008，图形卡是TeslaC2070，编译器是VS2010。 该程序使用单精度和双精度浮点计算。

我正在阅读CUDA编程指南3.2和4.0。 在附录中，指南告诉我sin() ， cos()最大准确度为2 ULP。 我原来的CPU程序产生的结果与CUDA版本不同。

我想使结果正确相同。 可能吗？

引用Goldberg （一篇论文，每个计算机科学家，计算科学家，甚至可能是每个编程的科学家都应该阅读）：

由于舍入误差，代数的关联定律不一定适用于浮点数。

这意味着当您更改操作顺序时 - 即使使用表面上的关联算法 - 您可能会得到稍微不同的答案。

根据定义，并行性导致相对于串行算术的不同操作顺序。 “令人尴尬的并行”计算，即每个输出元素独立于其他输出元素计算的计算，有时不必担心这一点。 但集体操作，如减少或扫描，以及空间邻域计算，如模板（如FDTD），确实会遇到这种影响。

实际上，即使使用不同的编译器（甚至不同的编译器选项）也可以改变浮点计算的结果，即使在编译相同的代码时也可以有或没有并行性。

[英]Scramble a floating point number?

[英]CUDA Floating Point Compare

[英]About compact operation in cuddpp

[英]Double precision floating point in CUDA

[英]Is double precision floating point emulated on Kepler for graphics?

[英]CUDA nvprof number of floating point ops

[英]CUDA floating point gives different results

[英]Division of floating point numbers on GPU different from that on CPU

[英]cuda and double-precision floating-point arithmetics

[英]CUDA customized atomicCAS for floating point types (like double)

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 打乱一个浮点数？ CUDA浮点比较关于cuddpp中的紧凑操作 CUDA中的双精度浮点开普勒是否在图形上模拟了双精度浮点？ CUDA nvprof浮点数操作数 CUDA浮点给出不同的结果 GPU上浮点数的划分与CPU上的浮点数划分不同 cuda和双精度浮点算术 CUDA 为浮点类型（如双精度）定制 atomicCAS

相关标签