为什么LLVM会分配一个冗余变量？

Question

这是一个带有枚举定义和main函数的简单 C 文件：

enum days {MON, TUE, WED, THU};

int main() {
    enum days d;
    d = WED;
    return 0;
}

它转换为以下 LLVM IR：

define dso_local i32 @main() #0 {
  %1 = alloca i32, align 4
  %2 = alloca i32, align 4
  store i32 0, i32* %1, align 4
  store i32 2, i32* %2, align 4
  ret i32 0
}

%2显然是d变量，它被分配了 2。 如果直接返回零， %1对应什么？

Answer 1

这个%1寄存器是由 clang 生成的，用于处理函数中的多个返回语句。 想象一下，您正在编写一个函数来计算整数的阶乘。 而不是这个

int factorial(int n){
    int result;
    if(n < 2)
      result = 1;
    else{
      result = n * factorial(n-1);
    }
    return result;
}

你可能会这样做

int factorial(int n){
    if(n < 2)
      return 1;
    return n * factorial(n-1);
}

为什么？ 因为 Clang 会插入保存返回值的result变量。 好极了。 这就是%1变量的原因。 查看 ir 以获取稍微修改过的代码版本。

修改后的代码，

enum days {MON, TUE, WED, THU};

int main() {
    enum days d;
    d = WED;
    if(d) return 1;
    return 0;
}

红外，

define dso_local i32 @main() #0 !dbg !15 {
    %1 = alloca i32, align 4
    %2 = alloca i32, align 4
    store i32 0, i32* %1, align 4
    store i32 2, i32* %2, align 4, !dbg !22
    %3 = load i32, i32* %2, align 4, !dbg !23
    %4 = icmp ne i32 %3, 0, !dbg !23
    br i1 %4, label %5, label %6, !dbg !25

 5:                                                ; preds = %0
   store i32 1, i32* %1, align 4, !dbg !26
   br label %7, !dbg !26

 6:                                                ; preds = %0
  store i32 0, i32* %1, align 4, !dbg !27
  br label %7, !dbg !27

 7:                                                ; preds = %6, %5
  %8 = load i32, i32* %1, align 4, !dbg !28
  ret i32 %8, !dbg !28
}

现在你看到%1变得有用了吧？ 大多数具有单个 return 语句的函数都将通过 llvm 的一个传递删除此变量。

Answer 2

为什么这很重要——实际问题是什么？

我认为您正在寻找的更深层次的答案可能是：LLVM 的架构基于相当简单的前端和许多通道。 前端必须生成正确的代码，但它不一定是好的代码。 他们可以做最简单的事情。

在这种情况下，Clang 生成了几条指令，但结果证明它们不会用于任何事情。 这通常不是问题，因为 LLVM 的某些部分会去掉多余的指令。 Clang 相信这会发生。 Clang 不需要避免发出死代码； 它的实现可能侧重于正确性、简单性、可测试性等。

Answer 3

因为 Clang 已经完成了语法分析，而 LLVM 甚至还没有开始优化。

Clang 前端生成了 IR（中间表示）而不是机器代码。 这些变量是 SSA（单一静态分配）； 它们尚未绑定到寄存器，实际上经过优化后，永远不会绑定到寄存器，因为它们是多余的。

该代码是源代码的某种字面表示。 这就是叮当交给 LLVM 进行优化。 基本上，LLVM 以此开始并从那里优化。 实际上，对于版本 10 和 x86_64， llc -O2最终会生成：

main: # @main
  xor eax, eax
  ret

为什么LLVM会分配一个冗余变量？

问题描述

3 个解决方案

解决方案1
4 已采纳 2020-05-02 21:01:09

解决方案2
1 2020-01-06 15:48:37

解决方案3
1 2020-05-02 15:27:35

为什么LLVM会分配一个冗余变量？

问题描述

3 个解决方案

解决方案1 4 已采纳 2020-05-02 21:01:09

解决方案2 1 2020-01-06 15:48:37

解决方案3 1 2020-05-02 15:27:35

解决方案1
4 已采纳 2020-05-02 21:01:09

解决方案2
1 2020-01-06 15:48:37

解决方案3
1 2020-05-02 15:27:35