為什么pow函數比簡單操作慢？

Question

從我的一個朋友那里，我聽說pow函數比簡單地乘以基數（即乘以其指數的次數）要慢得多。 例如，據他說，

#include <stdio.h>
#include <math.h>

int main () {
    double e = 2.71828
    e2 = pow (e, 2.0)
    printf("%le", e2)
}

比慢

#include <stdio.h>

int main() {
    double e = 2.71828
    e2 = e * e
    printf("%le", e2)
}

作為新手，我認為它們的編譯速度和邏輯相同，因此我更喜歡前者的典型信奉度。 那么，為什么前一個代碼塊比后一個代碼塊慢？

Answer 1

pow(double,double)需要處理任何冪 ，而不僅僅是基於整數的冪，尤其是2 。 這樣，它比僅對兩個double值進行簡單的乘法要復雜得多。

Answer 2

因為pow函數必須實現一個必須在所有情況下都可以使用的更通用的算法（特別是，它必須能夠提升為double表示的任何有理指數），而e*e只是一個簡單的乘法，它將沸騰精簡到一兩個匯編指令。

不過，如果編譯器足夠聰明，它可能會自動以e*e自動替換pow(e, 2.0) （嗯，實際上，在您的情況下，它可能只會在編譯時執行整個計算）。

只是為了好玩，我進行了一些測試：編譯以下代碼

#include <math.h>

double pow2(double value)
{
    return pow(value, 2.);
}

double knownpow2()
{
    double e=2.71828;
    return pow(e, 2.);
}

double valuexvalue(double value)
{
    return value*value;
}

double knownvaluexvalue()
{
    double e=2.71828;
    return e*e;
}

使用g++ -O3 -c pow.c （g ++ 4.7.3）並使用objdump -d -M intel pow.o分解輸出，我得到：

0000000000000000 <_Z4pow2d>:
   0:   f2 0f 59 c0             mulsd  xmm0,xmm0
   4:   c3                      ret    
   5:   66 66 2e 0f 1f 84 00    data32 nop WORD PTR cs:[rax+rax*1+0x0]
   c:   00 00 00 00 

0000000000000010 <_Z9knownpow2v>:
  10:   f2 0f 10 05 00 00 00    movsd  xmm0,QWORD PTR [rip+0x0]        # 18 <_Z9knownpow2v+0x8>
  17:   00 
  18:   c3                      ret    
  19:   0f 1f 80 00 00 00 00    nop    DWORD PTR [rax+0x0]

0000000000000020 <_Z11valuexvalued>:
  20:   f2 0f 59 c0             mulsd  xmm0,xmm0
  24:   c3                      ret    
  25:   66 66 2e 0f 1f 84 00    data32 nop WORD PTR cs:[rax+rax*1+0x0]
  2c:   00 00 00 00 

0000000000000030 <_Z16knownvaluexvaluev>:
  30:   f2 0f 10 05 00 00 00    movsd  xmm0,QWORD PTR [rip+0x0]        # 38 <_Z16knownvaluexvaluev+0x8>
  37:   00 
  38:   c3                      ret

因此，在編譯器已經知道所有涉及的值的地方，它只是在編譯時執行了計算。 對於pow2和valuexvalue它發出單個mulsd xmm0,xmm0 （即，在兩種情況下，都歸結為在單個匯編指令中值與自身的乘積）。

Answer 3

這是一個（簡單，請注意注釋）pow實現。 在泛型中，它涉及多個分支以及一個潛在的分支，並調用exp，log，modf ..

另一方面，在大多數更高的CPU上，乘法是一條指令（給定或取指令）。

為什么pow函數比簡單操作慢？

問題描述

3 個解決方案

解決方案1
5 已采納 2013-06-27 19:19:02

解決方案2
3 2013-06-27 19:19:18

解決方案3
0 2013-06-27 19:20:38

為什么pow函數比簡單操作慢？

問題描述

3 個解決方案

解決方案1 5 已采納 2013-06-27 19:19:02

解決方案2 3 2013-06-27 19:19:18

解決方案3 0 2013-06-27 19:20:38

解決方案1
5 已采納 2013-06-27 19:19:02

解決方案2
3 2013-06-27 19:19:18

解決方案3
0 2013-06-27 19:20:38