[英]How do nested scopes affect stack depth?
我尝试使用 MSVC 将以下 c 代码编译到带有 (CL TestFile.c /Fa /Ot) 和没有优化 (CL TestFile.c /Fa) 的汇编中,结果是它们产生相同的堆栈深度。
为什么编译器知道它将使用最多 16 个字节,却为 3 个变量 x、y 和 z 中的每一个使用 8 个字节? 代替y$1 = 4
和z$2 = 8
是否可以不使用y$1 = 4
和z$2 = 4
所以y
和z
在堆栈上使用相同的 memory 没有任何问题?
int main() {
int x = 123;
if (x == 123) {
int y = 321;
}
else {
int z = 234;
}
}
; Parts of the assembly code
x$ = 0
y$1 = 4
z$2 = 8
main PROC
$LN5:
sub rsp, 24
; And so on...
嵌套范围不影响堆栈深度。 根据 C 标准,嵌套范围会影响标识符的可见性,并且不会对 C 实现如何使用堆栈(如果有堆栈)施加任何要求。 C 标准允许 C 编译器生成具有相同可观察行为的任何代码。
对于问题中显示的程序,唯一可观察到的行为是以成功状态退出,因此一个好的编译器应该在优化时生成一个最小的程序。 例如, x86-64 的 GCC 10.2 只生成一个xor
和一个ret
:
main:
xor eax, eax
ret
Clang 11.0.1 也是如此。 如果 MSVC 没有,那就是它的缺陷。 (但是,开关/Os
和/Ot
可能不要求优化或不要求太多优化;当与其他优化开关一起使用时,它们可能只是表达对速度或时间的偏好。)
此外,一个好的编译器应该对对象的使用进行生命周期分析,构建一个图,表示节点在代码中的位置,并标有值的创建或使用,而有向边是潜在的程序控制流(或源的某种等效表示)代码)。 然后应生成汇编程序(或中间代码)以实现图所需的语义。 如果两组源代码具有等效图,则编译器应为它们生成等效的程序集(或中间代码)(达到处理复杂图的一些合理能力),无论是否使用嵌套范围中的定义。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.