繁体   English   中英

特斯拉双精度

[英]Tesla double precision

我正在寻找信息,如何在tesla gpu中实现硬件的双精度。 我已经读过,两个流处理器正在处理单个double值,但我没有找到任何来自nvidia的官方文件。

提前致谢。 PPS为什么大多数GPU只用单精度计算(因为颜色可以存储为RR.GG.BB.TT,其中每个字符是8位值)?

PS 谷歌它对我来说没有帮助

不支持double不是像你说的那样存储格式(RR.GG.BB.TT),而是使用本机内部函数(以及专用硬件)来处理double(add,mul,madd等)上的操作。

无论如何,大多数GPU仅支持单精度,因为大多数GPU市场都在于游戏市场,游戏玩家不需要双精度。 此外,大多数游戏玩家都在寻找良好的性价比。 在晶体管预算(和TDP)方面实施DP是成本很高的,如果游戏不使用双精度,这是没有意义的。

这就是为什么你看到高端ATI GPU支持双倍(HD 59xx和HD 58xx,但不是中端和入门级GPU,如HD 57xx及更低)。

@karlphillip:是的,对于像GTX 260这样的GPU,IEEE754(有点),但目前的ATI和NVIDIA一代支持高端部件的IEEE 754-2008

关于硬件实现,这是IHV通常不会告诉的秘密:)

特斯拉不是GPU,它是一系列具有各种高端GPU的协处理器。 如果您的特斯拉内置Fermi GPU,它应具有良好的双精度性能。

参见费米白皮书 ,第9页。

单精度对于常规GPU计算更为重要,因为它对于此类应用程序已足够。

根据维基

对于双精度(仅在GTX 260 [12]等较新的GPU中支持),与IEEE 754标准存在一些偏差:舍入到最近偶数是唯一支持的倒数,除法和平方根的舍入模式。 在单精度中,不支持非正规和信令NaN; 只支持两种IEEE舍入模式(斩波和舍入到最近的偶数),并且这些模式是在每个指令而不是在控制字中指定的; 并且除法/平方根的精度略低于单精度。

你去了,他们实现了IEEE 754的大部分规范,但实际的实现可能是私密的和秘密的。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM