繁体 English 中英

NVIDIA GPU上的IEEE-754标准（sm_13）

[英]IEEE-754 standard on NVIDIA GPU (sm_13)

原文 2012-04-26 13:22:07 8 1 cuda/ floating-point/ gpgpu/ ieee-754

如果我在主机和设备（GPU arch sm_13）上执行浮点（单精度）操作，那么值是否会不同？

1 个解决方案

NVIDIA的白皮书中提供了对此的良好讨论。 基本上：

IEEE-754几乎所有目前都在实施;
即使在忠实实施此标准之间，您仍然可以看到结果的差异（着名的是，英特尔在内部执行80位双精度），或者您的编译器的高优化设置可以改变结果
计算能力2.0及更高版本的NVIDIA显卡支持单精度和双精度的IEEE-754，只有非常小的警告
- 某些操作不支持某些舍入模式 - 仅当您明确更改代码中的舍入模式时，这才有意义
- 融合乘法和补充有一些细微之处
- CUDA还提供（稍微）较低的精度但更快的几个操作的实现，当然如果你明确或隐含地使用它们（使用编译器选项），你自然不会得到完整的ieee-754结果
计算能力1.3卡支持ieee-754，如上所述，双精度但不是单精度; （单精度不支持非正规 - 例如非常小 - 数字，没有FMA，平方根和除法不完全准确）
计算能力1.2卡只有单精度，并且那些不是如上所述的ieee-754。

nvcc fatal：未为选项“ gpu-architecture”定义值“ sm_13”

[英]nvcc fatal : Value 'sm_13' is not defined for option 'gpu-architecture'

“-arch sm_13”和“-arch sm_20”之间的区别是什么？

[英]what is difference between “-arch sm_13” and “-arch sm_20”

NVIDIA nvcc编译标志，用于constexpr深度和IEEE 754指数计算

[英]NVIDIA nvcc compilation flag for constexpr depth and IEEE 754 exponent computation

NVIDIA GPU的任务调度

[英]task scheduling of NVIDIA GPU

测量nvidia gpu的利用率

[英]Measure the utilization of nvidia gpu

GPU架构（Nvidia）

[英]GPU Architecture (Nvidia)

在NVIDIA GPU上编译ptx代码？

[英]compiling ptx code on NVIDIA GPU?

解释 GPU NVIDIA 执行时间

[英]Explain GPU NVIDIA execution time

带PCI接口的GPU上的nVidia CUDA

[英]nVidia CUDA on GPU with PCI interface

NVIDIA 安培 GPU 架构兼容性

[英]NVIDIA Ampere GPU Architecture Compatibility

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 nvcc fatal：未为选项“ gpu-architecture”定义值“ sm_13” “-arch sm_13”和“-arch sm_20”之间的区别是什么？ NVIDIA nvcc编译标志，用于constexpr深度和IEEE 754指数计算 NVIDIA GPU的任务调度测量nvidia gpu的利用率 GPU架构（Nvidia）在NVIDIA GPU上编译ptx代码？解释 GPU NVIDIA 执行时间带PCI接口的GPU上的nVidia CUDA NVIDIA 安培 GPU 架构兼容性

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM