為什么這段代碼會阻止gcc＆llvm進行尾調優化？

Question

我曾嘗試在GCC 4.4.5在Linux在Mac OSX（4.2.1的Xcode）和下面的代碼和gcc-LLVM 此。 以下是相關功能的來源和生成的反匯編。 （補充：使用gcc -O2 main.c編譯）

#include <stdio.h>
__attribute__((noinline))
static void g(long num)
{
        long m, n;
        printf("%p %ld\n", &m, n);
        return g(num-1);
}
__attribute__((noinline))
static void h(long num)
{
        long m, n;
        printf("%ld %ld\n", m, n);
        return h(num-1);
}
__attribute__((noinline))
static void f(long * num)
{
        scanf("%ld", num);
        g(*num);
        h(*num);        
        return f(num);
}
int main(void)
{
        printf("int:%lu long:%lu unsigned:%lu\n", sizeof(int), sizeof(long), sizeof(unsigned));
        long num;
        f(&num);                 
        return 0;
}

08048430 <g>:
8048430:    55                   push   %ebp
8048431:    89 e5                mov    %esp,%ebp
8048433:    53                   push   %ebx
8048434:    89 c3                mov    %eax,%ebx
8048436:    83 ec 24             sub    $0x24,%esp
8048439:    8d 45 f4             lea    -0xc(%ebp),%eax
804843c:    c7 44 24 08 00 00 00 movl   $0x0,0x8(%esp)
8048443:    00 
8048444:    89 44 24 04          mov    %eax,0x4(%esp)
8048448:    c7 04 24 d0 85 04 08 movl   $0x80485d0,(%esp)
804844f:    e8 f0 fe ff ff       call   8048344 <printf@plt>
8048454:    8d 43 ff             lea    -0x1(%ebx),%eax
8048457:    e8 d4 ff ff ff       call   8048430 <g>
804845c:    83 c4 24             add    $0x24,%esp
804845f:    5b                   pop    %ebx
8048460:    5d                   pop    %ebp
8048461:    c3                   ret    
8048462:    8d b4 26 00 00 00 00 lea    0x0(%esi,%eiz,1),%esi
8048469:    8d bc 27 00 00 00 00 lea    0x0(%edi,%eiz,1),%edi

08048470 <h>:
8048470:    55                   push   %ebp
8048471:    89 e5                mov    %esp,%ebp
8048473:    83 ec 18             sub    $0x18,%esp
8048476:    66 90                xchg   %ax,%ax
8048478:    c7 44 24 08 00 00 00 movl   $0x0,0x8(%esp)
804847f:    00 
8048480:    c7 44 24 04 00 00 00 movl   $0x0,0x4(%esp)
8048487:    00 
8048488:    c7 04 24 d8 85 04 08 movl   $0x80485d8,(%esp)
804848f:    e8 b0 fe ff ff       call   8048344 <printf@plt>
8048494:    eb e2                jmp    8048478 <h+0x8>
8048496:    8d 76 00             lea    0x0(%esi),%esi
8048499:    8d bc 27 00 00 00 00 lea    0x0(%edi,%eiz,1),%edi

080484a0 <f>:
80484a0:    55                   push   %ebp
80484a1:    89 e5                mov    %esp,%ebp
80484a3:    53                   push   %ebx
80484a4:    89 c3                mov    %eax,%ebx
80484a6:    83 ec 14             sub    $0x14,%esp
80484a9:    8d b4 26 00 00 00 00 lea    0x0(%esi,%eiz,1),%esi
80484b0:    89 5c 24 04          mov    %ebx,0x4(%esp)
80484b4:    c7 04 24 e1 85 04 08 movl   $0x80485e1,(%esp)
80484bb:    e8 94 fe ff ff       call   8048354 <__isoc99_scanf@plt>
80484c0:    8b 03                mov    (%ebx),%eax
80484c2:    e8 69 ff ff ff       call   8048430 <g>
80484c7:    8b 03                mov    (%ebx),%eax
80484c9:    e8 a2 ff ff ff       call   8048470 <h>
80484ce:    eb e0                jmp    80484b0 <f+0x10>

我們可以看到除了printf()的參數m旁邊的& （地址）運算符（以及無關的%ld和%p ）之外， g()和h()大部分都是相同的。 但是， h()是尾調用優化而g()不是。 為什么？

Answer 1

在g（）中，您將獲取局部變量的地址並將其傳遞給函數。 “足夠智能的編譯器”應該意識到printf不存儲該指針。 相反，gcc和llvm假設printf可能將指針存儲在某處，因此包含m的調用框架可能需要在遞歸中進一步“生存”。 因此，沒有TCO。

Answer 2

這就是＆它做到了。 它告訴編譯器m應該存儲在堆棧中。 即使它被傳遞給printf ，編譯器也必須假設它可能被其他人訪問，因此必須在調用g之后從堆棧中清除它。

在這種特殊情況下，由於編譯器已知printf （並且它知道它不保存指針），因此可能會教它執行此優化。

有關這方面的更多信息，請查看“逃避分析”。

為什么這段代碼會阻止gcc＆llvm進行尾調優化？

問題描述

2 個解決方案

解決方案1
6 已采納 2012-12-30 05:20:31

解決方案2
3 2012-12-30 05:37:02

為什么這段代碼會阻止gcc＆llvm進行尾調優化？

問題描述

2 個解決方案

解決方案1 6 已采納 2012-12-30 05:20:31

解決方案2 3 2012-12-30 05:37:02

解決方案1
6 已采納 2012-12-30 05:20:31

解決方案2
3 2012-12-30 05:37:02