繁体 English 中英

卡汉求和

[英]Kahan summation

原文 2011-02-09 00:15:20 3 4 algorithm/ floating-point

有人在应用程序中使用过 Kahan 求和吗？ 额外的精度什么时候有用？

我听说在某些平台上，双重操作比浮动操作更快。 我怎样才能在我的机器上测试这个？

4 个解决方案

当您对数字求和并且需要最小化最坏情况的浮点错误时， Kahan 求和效果很好。 如果没有这种技术，如果您有两个数的大小相差可用有效数字（例如 1 + 1e-12），则加法运算的精度可能会显着降低。 Kahan 求和补偿了这一点。

这里有一个关于浮点问题的极好的资源，“每个计算机科学家都应该知道的浮点运算知识”： http ://www.validlab.com/goldberg/paper.pdf

关于单精度与双精度性能：是的，单精度可以明显更快，但这取决于特定的机器。 请参阅： https ://www.hpcwire.com/2006/06/16/less_is_more_exploiting_single_precision_math_in_hpc-1/

最好的测试方法是编写一个简短的示例来测试您关心的操作，同时使用单精度（浮点）和双精度，并测量运行时间。

我使用 Kahan 求和进行蒙特卡洛积分。 您有一个标量值函数f ，您认为它的计算成本相当高； 一个合理的估计是 65ns/维度。 然后将这些值累加到平均值中——更新平均值大约需要 4ns。 因此，如果您使用 Kahan 求和（4 倍的触发器，~16ns）更新平均值，那么您实际上并没有向总数添加那么多计算。 , but this is incorrect.现在常说蒙特卡洛积分的误差为σ/√ ，其实这是不正确的。 实际误差界限（在有限精度算术中）是

+ cond( )ε N σ/√ + cond( )ε N

) is the condition number of summation and ε is twice the unit roundoff.其中 cond( ) 是求和的条件数，ε 是单位舍入的两倍。 所以算法发散比收敛快。 对于 32 位算术，获得 ε N ~ 1 很简单：可以非常快速地完成 10^7 次评估，之后您的蒙特卡洛积分将进行随机游走。 当条件数很大时，情况更糟。

如果使用 Kahan 求和，则错误的表达式变为

+ cond( )ε ² N, σ/√ + cond( )ε ² N,

诚然，它的发散速度仍然快于收敛速度，但 ε ² N 在现代硬件上无法在合理的时间尺度上变大。

在计算运行平均值时，我使用 Kahan 求和来补偿累积误差。 它确实有很大的不同，而且很容易测试。 仅经过 100 次求和，我就消除了相当大的错误。

我肯定会使用 Kahan 求和算法来补偿任何运行总计中的错误。

但是，我注意到在进行逆矩阵乘法时出现了相当大的 ( 1e-3 ) 错误。 基本上， A*x = y ，然后是inv(A)*y ~= x我没有准确地恢复原始值。 这很好，但我认为 Kahan 求和可能会有所帮助（有很多加法），尤其是对于 >3×3 的较大矩阵。 我尝试使用 4×4 矩阵，但它根本没有改善这种情况。