[英]Understanding assembly language
我试图理解与上面的C代码有关的汇编代码。 我不确定自己是否走在正确的轨道上,所以也许有人可以帮助我更好地理解这一点。
int silly(int n, int *p)
{
int val, val2;
if (n > 0)
val2 = silly(n << 1, &val);
else
val = val2 = 0;
*p = val + val2 + n;
return val + val2;
}
这会产生以下机器代码:
silly:
pushl %ebp // Here I am making space for the function on the stack
movl %esp,%ebp // Moving the stack pointer where the base pointer is
subl $20,%esp // Subtracting 20 from the stack pointer to allocate more space
pushl %ebx // Pushing the %ebx register on top of the stack
movl 8(%ebp),%ebx // Getting the first argument(which is n) and store it in register %ebx
testl %ebx,%ebx // The first if-statement which compares if n > 0
jle .L3 // Jump if less or equal - meaning if n < 0 then jump to .L3
addl $-8,%esp // Add -8 to %esp to allocate more space
leal -4(%ebp),%eax // Storing the first local variable (which is val) in %eax
pushl %eax // Pushing the register %eax on top of the stack
leal (%ebx,%ebx),%eax // n + n and stores it as 2n in %eax
pushl %eax // Pushing register %eax on top of the stack (Which I find strange
// considering that I've just pushed %eax onto the stack above
call silly // Call the function silly
jmp .L4 // Jump to .L4 (Unconditionally)
.p2align 4,,7 // Don't know what this means.
.L3: // .L3 is the else-statement
xorl %eax,%eax // Basically making %eax = 0
movl %eax,-4(%ebp) // Moving the value in %eax which is 0 to the first local variable
// meaning val = 0
.L4: // .L4 is the section after the else-statement
movl -4(%ebp),%edx // Getting val again and now storing it in %edx
addl %eax,%edx // Adding what is in %eax (which is 0) to %edx
movl 12(%ebp),%eax // Getting the second parameter (*p) and storing it in %eax
addl %edx,%ebx // Adding value from %edx to %ebx - meaning val + n
movl %ebx,(%eax) // Moving what is in %ebx and storing it in memory location of %eax
movl -24(%ebp),%ebx // Getting the second local variable (val2) and moving it to %ebx
movl %edx,%eax // Move val to %eax - and the return value will be in %eax
movl %ebp,%esp
popl %ebp
ret
我试图绕过这个,我刚开始考虑装配,所以关于这个主题的指针会非常好。 关于这个汇编代码我需要问几个问题,这有助于我理解堆栈:
(a)变量val是否存储在堆栈中?
(b)如果是这样,它存储的是什么字节oset(相对于%ebp)?
(c)为什么有必要将它存放在堆栈上?
(a)变量val2是否存储在堆栈中?
(b)如果是这样,它存储的是什么字节oset(相对于%ebp)?
(c)为什么有必要将它存放在堆栈上?
(a)什么(如果有的话)存储在-24(%ebp)?
(b)如果存储了某些东西,为什么需要存储它?
(a)什么(如果有的话)存储在-8(%ebp)?
(b)如果存储了某些东西,为什么需要存储它?
提前致谢 :)
在回答你的问题之前。 而不是什么注释代码是干什么的,我的评论,所有的值都在寄存器或堆栈。
参数在堆栈上,返回值在%eax
。
寄存器%eax
, %ecx
和%edx
被调用者保存。 所有其他寄存器,包括%ebx
, %ebp
和%esp
,都是被调用者保存的( %edi
和%esi
未使用)。
我的堆栈符号一次是4个字节,我使用;
对于ebp指向的地方,如果已知的话。
silly: ; eax: ?, ebx: ebx0, edx: ?, stack: [eip0, n, p]
pushl %ebp ; eax: ?, ebx: ebx0, edx: ?, stack: [ebp0, eip0, n, p]
movl %esp,%ebp ; eax: ?, ebx: ebx0, edx: ?, stack: [; ebp0, eip0, n, p]
subl $20,%esp ; eax: ?, ebx: ebx0, edx: ?, stack: [?, ?, ?, ?, ?; ebp0, eip0, n, p]
pushl %ebx ; eax: ?, ebx: ebx0, edx: ?, stack: [ebx0, ?, ?, ?, ?, ?; ebp0, eip0, n, p]
movl 8(%ebp),%ebx ; eax: ?, ebx: n, edx: ?, stack: [ebx0, ?, ?, ?, ?, ?; ebp0, eip0, n, p]
testl %ebx,%ebx ; set flags from n
jle .L3 ; if flags indicates <= 0, goto .L3, else fallthrough
; set up for calling the function
addl $-8,%esp ; eax: ?, ebx: n, edx: ?, stack: [?, ?, ebx0, ?, ?, ?, ?, ?; ebp0, eip0, n, p]
leal -4(%ebp),%eax ; eax: &val, ebx: n, edx: ?, stack: [?, ?, ebx0, ?, ?, ?, ?, (stackeax); ebp0, eip0, n, p]
pushl %eax ; eax: &val, ebx: n, edx: ?, stack: [&val, ?, ?, ebx0, ?, ?, ?, ?, val=?; ebp0, eip0, n, p]
leal (%ebx,%ebx),%eax ; eax: 2*n, ebx: n, edx: ?, stack: [&val, ?, ?, ebx0, ?, ?, ?, ?, val=?; ebp0, eip0, n, p]
pushl %eax ; eax: 2*n, ebx: n, edx: ?, stack: [2*n, &val, ?, ?, ebx0, ?, ?, ?, ?, val=?; ebp0, eip0, n, p]
call silly ; pushes eip; args: (2*n, &val); val will be initialized on return
jmp .L4 ;
;
.p2align 4,,7 ; request alignment (there should be one before `silly:` too)
.L3: ;
xorl %eax,%eax ; eax: val=0, ebx: n, edx: ?, stack: [ebx0, ?, ?, ?, ?, ?; ebp0, eip0, n, p]
movl %eax,-4(%ebp) ; eax: val=0, ebx: n, edx: ?, stack: [ebx0, ?, ?, ?, ?, val; ebp0, eip0, n, p]
;
.L4: ; eax: val2=φ(function result, 0), ebx: n, edx: ?, stack: [..., ebx0, ?, ?, ?, ?, val; ebp0, eip0, n, p]
movl -4(%ebp),%edx ; eax: val2, ebx: n, edx: val, stack: [..., ebx0, ?, ?, ?, ?, val; ebp0, eip0, n, p]
addl %eax,%edx ; eax: val2, ebx: n, edx: val+val2, stack: [..., ebx0, ?, ?, ?, ?, val; ebp0, eip0, n, p]
movl 12(%ebp),%eax ; eax: p, ebx: n, edx: val+val2, stack: [..., ebx0, ?, ?, ?, ?, val; ebp0, eip0, n, p]
addl %edx,%ebx ; eax: p, ebx: n+val+val2, edx: val+val2, stack: [..., ebx0, ?, ?, ?, ?, val; ebp0, eip0, n, p]
movl %ebx,(%eax) ; *p = n+val+val2
movl -24(%ebp),%ebx ; eax: p, ebx: ebx0, edx: val+val2, stack: [..., ebx0, ?, ?, ?, ?, val; ebp0, eip0, n, p]
movl %edx,%eax ; eax: val+val2, ebx: ebx0, edx: val+val2, stack: [..., ebx0, ?, ?, ?, ?, val; ebp0, eip0, n, p]
movl %ebp,%esp ; eax: val+val2, ebx: ebx0, edx: val+val2, stack: [; ebp0, eip0, n, p]
popl %ebp ; eax: val+val2, ebx: ebx0, edx: val+val2, stack: [eip0, n, p]
ret ; eax: val+val2, ebx: ebx0, edx: val+val2, stack: [n, p]
停止
返回并重新读取代码。 如果你不自己找出答案,那你只会伤到自己。 我写的那些评论应该很容易。
但无论如何 ...
val
通常在堆栈上,为-4(%ebp)
。 唯一没有的是xorl %eax,%eax
-4(%ebp)
,如线leal -4(%ebp),%eax
, movl %eax,-4(%ebp)
和movl -4(%ebp),%edx
。 另外,前一帧的val
是*p
val
必须位于堆栈上,以便可以获取其地址并将其传递给递归调用。 val2
永远不会存储在堆栈中,尽管很可能是其中的一部分?
s是为它保留的空间。 eax
在.L4
,其在披函数的第一支路是递归调用的返回值,并在第二分支是值0
,将其也存储在val
。 val2
永远不需要在堆栈上,因为它的地址不被占用,它在递归调用之前不存在,所以它不需要保存,并且使用的寄存器很少,不需要溢出。 -24(%ebp)
是%ebx
的保存值,来自pushl %ebx
%ebx
是被调用者保存的寄存器,因此必须保留其值。 val2
。 我最好的猜测是其他三个?
s保留用于未使用的递归调用调用者保存的寄存器: %eax
, %ecx
和%edx
。 你问了很多。
我将从这部分开始......
.p2align 4,,7 // Don't know what this means.
了解; 模糊不清,不是吗!
程序员(在您的情况下看起来像编译器)希望L3:
处的指令位于所谓的“16字节边界”上。
你可以在这里阅读有关这些东西的详细信息。 如果这没有意义,请回到这里,我会再解释一下。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.