簡體   English   中英

C++ 編譯器是否會使用少量術語內聯 for 循環?

[英]Will a C++ compiler inline a for-loop with a small number of terms?

假設我有一個Matrix5x5類(具有適當重載的索引運算符)並且我編寫了一個方法trace來計算其對角線元素的總和:

double Matrix5x5::trace(void){
    double t(0.0);
    for(int i(0); i <= 4; ++i){
        t += (*this)[i][i];
    }
    return t;
}

當然,如果我改為寫:

return (*this)[0][0]+(*this)[1][1]+(*this)[2][2]+(*this)[3][3]+(*this)[4][4];

那么我一定會避免聲明和增加i變量的開銷。 但是寫出所有這些術語感覺很愚蠢!

由於我的循環的constexpr數恰好很小,編譯器會為我內聯它嗎?

如果您的編譯器足夠聰明,它可以使用as-if 規則優化這種情況。 C++ 編譯器可能會以這種方式優化很多東西。 但它也可能不是。 唯一確定的方法是檢查您的特定編譯器生成的代碼。 話雖如此,這不太可能成為您程序中的瓶頸。 所以做哪個版本更具可讀性。

是的! GCC 在優化級別-O1及更高級別執行此操作,而 clang 在優化級別-O2及更高級別執行此操作。

我使用以下代碼對其進行了測試:

struct Matrix5x5 {
    double values[5][5];
    Matrix5x5() : values() {}

    double trace() {
        double sum = 0.0;
        for(int i = 0; i < 5; i++) {
            sum += values[i][i]; 
        }
        return sum; 
    }
};

double trace_of(Matrix5x5& m) {
    return m.trace(); 
}

這是 gcc 和 clang 生成的程序集:

trace_of(Matrix5x5&):
    pxor    xmm0, xmm0
    addsd   xmm0, QWORD PTR [rdi]
    addsd   xmm0, QWORD PTR [rdi+48]
    addsd   xmm0, QWORD PTR [rdi+96]
    addsd   xmm0, QWORD PTR [rdi+144]
    addsd   xmm0, QWORD PTR [rdi+192]
    ret

您可以使用代碼,並在此處查看相應的程序集: https : //godbolt.org/z/p2uF0E

如果您重載operator[] ,那么您必須將優化級別提高到-O3 ,但編譯器仍然會這樣做: https : //godbolt.org/z/JInIME

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM