![](/img/trans.png)
[英]Assembly , syscall not work as expected. Ubuntu Linux x86_64 , using AT&T syntax
[英]Why does this simple assembly program work in AT&T syntax but not Intel syntax?
这段代码有什么问题(在 x86_64 Linux 上运行)?
.intel_syntax
.text
.globl _start
_start:
mov rax, 1
mov rdi, 1
mov rsi, msg
mov rdx, 14
syscall
mov rax, 60
mov rdi, 0
syscall
.data
msg:
.ascii "Hello, world!\n"
当我运行它时:
$ clang -o hello_intel hello_intel.s -nostdlib && ./hello_intel
没有输出。 让我们跟踪它:
$ strace ./hello_intel
execve("./hello_intel", ["./hello_intel"], [/* 96 vars */]) = 0
write(1, 0x77202c6f6c6c6548, 14) = -1 EFAULT (Bad address)
exit(0) = ?
+++ exited with 0 +++
它正在取消引用msg
而不是使用它的位置。 为什么?
如果我改用 AT&T 语法...
.text
.globl _start
_start:
mov $1, %rax
mov $1, %rdi
mov $msg, %rsi
mov $14, %rdx
syscall
mov $60, %rax
mov $0, %rdi
syscall
.data
msg:
.ascii "Hello, world!\n"
...它工作正常:
$ clang -o hello_att hello_att.s -nostdlib && ./hello_att
Hello, world!
这两者有什么区别?
这是工作之一:
$ objdump -d hello_att -s -M intel
hello_att: file format elf64-x86-64
Contents of section .text:
4000e8 48c7c001 00000048 c7c70100 000048c7 H......H......H.
4000f8 c6160160 0048c7c2 0e000000 0f0548c7 ...`.H........H.
400108 c03c0000 0048c7c7 00000000 0f05 .<...H........
Contents of section .data:
600116 48656c6c 6f2c2077 6f726c64 210a Hello, world!.
Disassembly of section .text:
00000000004000e8 <_start>:
4000e8: 48 c7 c0 01 00 00 00 mov rax,0x1
4000ef: 48 c7 c7 01 00 00 00 mov rdi,0x1
4000f6: 48 c7 c6 16 01 60 00 mov rsi,0x600116
4000fd: 48 c7 c2 0e 00 00 00 mov rdx,0xe
400104: 0f 05 syscall
400106: 48 c7 c0 3c 00 00 00 mov rax,0x3c
40010d: 48 c7 c7 00 00 00 00 mov rdi,0x0
400114: 0f 05 syscall
这是破碎的:
$ objdump -d hello_intel -s -M intel
hello_intel: file format elf64-x86-64
Contents of section .text:
4000e8 48c7c001 00000048 c7c70100 0000488b H......H......H.
4000f8 34251701 600048c7 c20e0000 000f0548 4%..`.H........H
400108 c7c03c00 000048c7 c7000000 000f05 ..<...H........
Contents of section .data:
600117 48656c6c 6f2c2077 6f726c64 210a Hello, world!.
Disassembly of section .text:
00000000004000e8 <_start>:
4000e8: 48 c7 c0 01 00 00 00 mov rax,0x1
4000ef: 48 c7 c7 01 00 00 00 mov rdi,0x1
4000f6: 48 8b 34 25 17 01 60 mov rsi,QWORD PTR ds:0x600117
4000fd: 00
4000fe: 48 c7 c2 0e 00 00 00 mov rdx,0xe
400105: 0f 05 syscall
400107: 48 c7 c0 3c 00 00 00 mov rax,0x3c
40010e: 48 c7 c7 00 00 00 00 mov rdi,0x0
400115: 0f 05 syscall
所以这里的重要区别是0x600116
与QWORD PTR ds:0x600117
,这确实看起来像是指针和取消引用指针之间的区别。
那么如何不解引用 Intel 语法代码中的指针呢?
这是适用于 GCC 的代码:
.intel_syntax noprefix
.text
.globl _start
_start:
mov rax, 1
mov rdi, 1
mov rsi, offset msg
mov rdx, 14
syscall
mov rax, 60
mov rdi, 0
syscall
.data
msg:
.ascii "Hello, world!\n"
必须添加noprefix
和offset
。 可悲的是,这不适用于 clang :
hello_intel.s:8:24: error: unknown token in expression
mov rsi, offset msg
^
但是,您可以通过使用lea
而不是mov
来解决这个问题:
lea rsi, [msg+rip]
这适用于 clang 和 gcc。 (并在与位置无关的代码中工作)。 这是将静态地址放入寄存器的标准方法。
mov esi, imm32
是对 RIP 相对 LEA 的次要优化,用于位置相关,但mov rsi, sign_extended_imm32
与 LEA 的代码大小相同。 在 Clang 的.intel_syntax
显然是不可能的,即使 clang 在编译时发出offset msg
: How to get `mov rdx, symbol` 来移动符号值而不是在 clang intel-syntax 中符号地址的值?
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.