為什么GCC沒有優化這個尾調用？

Question

我有使用內聯列表的代碼。 我用尾調用。 不幸的是，GCC沒有優化通話。

這是遞歸計算鏈表長度的函數的C代碼：

size_t ll_length(const ll_t* list) {
    return ll_length_rec(list, 0);
}

size_t ll_length_rec(const ll_t* list, size_t size_so_far)
{
    if (list)   {
        return ll_length_rec(list->next, size_so_far + 1);
    } else {
        return size_so_far;
    }
}

這是匯編程序代碼：

.globl _ll_length_rec
_ll_length_rec:
LFB8:
    .loc 1 47 0
    pushq   %rbp
LCFI6:
    movq    %rsp, %rbp
LCFI7:
    subq    $32, %rsp
LCFI8:
    movq    %rdi, -8(%rbp)
    movq    %rsi, -16(%rbp)
    .loc 1 48 0
    cmpq    $0, -8(%rbp)
    je  L8
    .loc 1 49 0
    movq    -16(%rbp), %rsi
    incq    %rsi
    movq    -8(%rbp), %rax
    movq    8(%rax), %rdi
    call    _ll_length_rec  # < THIS SHOUD BE OPTIMIZED
    movq    %rax, -24(%rbp)
    jmp L10

如果GCC會對其進行優化，那么asm就沒有call 。 我編譯它：

gcc  -S -fnested-functions -foptimize-sibling-calls \
    -03 -g -Wall -o llist llist.c

和GCC版本是：

i686-apple-darwin10-gcc-4.2.1 (GCC) 4.2.1 (Apple Inc. build 5666) (dot 3)

Answer 1

如果我將-O3添加到你的編譯行，它似乎不會產生有問題的調用，而沒有它，我得到未經優化的調用。 我不知道我頭腦中的所有gcc選項，但-03是-O3或故意的錯字？

Ltmp2:
        pushq   %rbp
Ltmp0:
        movq    %rsp, %rbp
Ltmp1:
        jmp     LBB1_1
        .align  4, 0x90
LBB1_3:
        addq    $2, %rsi
Ltmp3:
        movq    (%rax), %rdi
Ltmp4:
LBB1_1:
Ltmp5:
        testq   %rdi, %rdi
        je      LBB1_5
Ltmp6:
        movq    (%rdi), %rax
        testq   %rax, %rax
        jne     LBB1_3
        incq    %rsi
LBB1_5:
        movq    %rsi, %rax
Ltmp7:
Ltmp8:
        popq    %rbp
        ret

Answer 2

很可能是因為你的函數都沒有聲明為static ，這意味着如果鏈接時任何其他編譯單元需要它們，那么符號必須對鏈接器可見。 嘗試使用-fwhole-program標志進行編譯，看看會發生什么。

Answer 3

可能取決於GCC的版本和特定版本。 這是我在Windows上從-O2及以上開始從GCC 3.4.4獲得的

.globl _ll_length_rec
    .def    _ll_length_rec; .scl    2;  .type   32; .endef
_ll_length_rec:
    pushl   %ebp
    movl    %esp, %ebp
    movl    8(%ebp), %edx
    movl    12(%ebp), %eax
    jmp L3
    .p2align 4,,7
L6:
    movl    (%edx), %edx
    incl    %eax
L3:
    testl   %edx, %edx
    jne L6
    popl    %ebp
    ret

為什么GCC沒有優化這個尾調用？

問題描述

3 個解決方案

解決方案1
9 已采納 2013-07-13 07:35:59

解決方案2
2 2013-07-13 07:26:39

解決方案3
1 2013-07-13 07:36:38

為什么GCC沒有優化這個尾調用？

問題描述

3 個解決方案

解決方案1 9 已采納 2013-07-13 07:35:59

解決方案2 2 2013-07-13 07:26:39

解決方案3 1 2013-07-13 07:36:38

解決方案1
9 已采納 2013-07-13 07:35:59

解決方案2
2 2013-07-13 07:26:39

解決方案3
1 2013-07-13 07:36:38