[英]Will a C++ compiler inline a for-loop with a small number of terms?
假設我有一個Matrix5x5
類(具有適當重載的索引運算符)並且我編寫了一個方法trace
來計算其對角線元素的總和:
double Matrix5x5::trace(void){
double t(0.0);
for(int i(0); i <= 4; ++i){
t += (*this)[i][i];
}
return t;
}
當然,如果我改為寫:
return (*this)[0][0]+(*this)[1][1]+(*this)[2][2]+(*this)[3][3]+(*this)[4][4];
那么我一定會避免聲明和增加i
變量的開銷。 但是寫出所有這些術語感覺很愚蠢!
由於我的循環的constexpr
數恰好很小,編譯器會為我內聯它嗎?
如果您的編譯器足夠聰明,它可以使用as-if 規則優化這種情況。 C++ 編譯器可能會以這種方式優化很多東西。 但它也可能不是。 唯一確定的方法是檢查您的特定編譯器生成的代碼。 話雖如此,這不太可能成為您程序中的瓶頸。 所以做哪個版本更具可讀性。
是的! GCC 在優化級別-O1
及更高級別執行此操作,而 clang 在優化級別-O2
及更高級別執行此操作。
我使用以下代碼對其進行了測試:
struct Matrix5x5 {
double values[5][5];
Matrix5x5() : values() {}
double trace() {
double sum = 0.0;
for(int i = 0; i < 5; i++) {
sum += values[i][i];
}
return sum;
}
};
double trace_of(Matrix5x5& m) {
return m.trace();
}
這是 gcc 和 clang 生成的程序集:
trace_of(Matrix5x5&):
pxor xmm0, xmm0
addsd xmm0, QWORD PTR [rdi]
addsd xmm0, QWORD PTR [rdi+48]
addsd xmm0, QWORD PTR [rdi+96]
addsd xmm0, QWORD PTR [rdi+144]
addsd xmm0, QWORD PTR [rdi+192]
ret
您可以使用代碼,並在此處查看相應的程序集: https : //godbolt.org/z/p2uF0E 。
如果您重載operator[]
,那么您必須將優化級別提高到-O3
,但編譯器仍然會這樣做: https : //godbolt.org/z/JInIME
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.