繁体 English 中英

特斯拉双精度

[英]Tesla double precision

原文 2010-08-11 14:14:12 2 3 double/ cuda/ opencl

我正在寻找信息，如何在tesla gpu中实现硬件的双精度。 我已经读过，两个流处理器正在处理单个double值，但我没有找到任何来自nvidia的官方文件。

提前致谢。 PPS为什么大多数GPU只用单精度计算（因为颜色可以存储为RR.GG.BB.TT，其中每个字符是8位值）？

PS 谷歌它对我来说没有帮助

3 个解决方案

不支持double不是像你说的那样存储格式（RR.GG.BB.TT），而是使用本机内部函数（以及专用硬件）来处理double（add，mul，madd等）上的操作。

无论如何，大多数GPU仅支持单精度，因为大多数GPU市场都在于游戏市场，游戏玩家不需要双精度。 此外，大多数游戏玩家都在寻找良好的性价比。 在晶体管预算（和TDP）方面实施DP是成本很高的，如果游戏不使用双精度，这是没有意义的。

这就是为什么你看到高端ATI GPU支持双倍（HD 59xx和HD 58xx，但不是中端和入门级GPU，如HD 57xx及更低）。

@karlphillip：是的，对于像GTX 260这样的GPU，IEEE754（有点），但目前的ATI和NVIDIA一代支持高端部件的IEEE 754-2008 。

关于硬件实现，这是IHV通常不会告诉的秘密:)

特斯拉不是GPU，它是一系列具有各种高端GPU的协处理器。 如果您的特斯拉内置Fermi GPU，它应具有良好的双精度性能。

参见费米白皮书，第9页。

单精度对于常规GPU计算更为重要，因为它对于此类应用程序已足够。

根据维基：

对于双精度（仅在GTX 260 [12]等较新的GPU中支持），与IEEE 754标准存在一些偏差：舍入到最近偶数是唯一支持的倒数，除法和平方根的舍入模式。 在单精度中，不支持非正规和信令NaN; 只支持两种IEEE舍入模式（斩波和舍入到最近的偶数），并且这些模式是在每个指令而不是在控制字中指定的; 并且除法/平方根的精度略低于单精度。

你去了，他们实现了IEEE 754的大部分规范，但实际的实现可能是私密的和秘密的。