[英]Working of __asm__ __volatile__ (“” : : : “memory”)
什么基本上__asm__ __volatile__ ()
和ARM架构的"memory"
什么意义呢?
asm volatile("" ::: "memory");
创建编译器级别内存屏障,强制优化器不会跨屏障重新排序内存访问。
例如,如果您需要按特定顺序访问某个地址(可能是因为该内存区域实际上是由不同的设备而不是内存支持),您需要能够告诉编译器,否则它可能只是优化您的步骤效率的缘故。
假设在这种情况下,您必须增加地址中的值,读取内容并增加相邻地址中的另一个值。
int c(int *d, int *e) {
int r;
d[0] += 1;
r = e[0];
d[1] += 1;
return r;
}
问题是编译器(在这种情况下为gcc
)可以重新安排内存访问,以便在需要时获得更好的性能( -O
)。 可能会导致如下所示的一系列指令:
00000000 <c>:
0: 4603 mov r3, r0
2: c805 ldmia r0, {r0, r2}
4: 3001 adds r0, #1
6: 3201 adds r2, #1
8: 6018 str r0, [r3, #0]
a: 6808 ldr r0, [r1, #0]
c: 605a str r2, [r3, #4]
e: 4770 bx lr
d[0]
和d[1]
上述值同时加载。 让我们假设这是你想要避免的事情然后你需要告诉编译器不要重新排序内存访问,那就是使用asm volatile("" ::: "memory")
。
int c(int *d, int *e) {
int r;
d[0] += 1;
r = e[0];
asm volatile("" ::: "memory");
d[1] += 1;
return r;
}
所以你会得到你想要的指令序列:
00000000 <c>:
0: 6802 ldr r2, [r0, #0]
2: 4603 mov r3, r0
4: 3201 adds r2, #1
6: 6002 str r2, [r0, #0]
8: 6808 ldr r0, [r1, #0]
a: 685a ldr r2, [r3, #4]
c: 3201 adds r2, #1
e: 605a str r2, [r3, #4]
10: 4770 bx lr
12: bf00 nop
应该注意的是,这只是编译时内存屏障,以避免编译器重新排序内存访问,因为它没有额外的硬件级指令来刷新内存或等待加载或存储完成。 如果CPU具有架构功能并且内存地址是normal
类型而不是strongly ordered
或device
( ref ),则CPU仍然可以重新排序内存访问。
此序列是编译器内存访问调度障碍,如Udo引用的文章中所述。 这个是GCC特定的 - 其他编译器有其他方式来描述它们,其中一些具有更明确(和更少深奥)的语句。
__asm__
是允许嵌套在C代码中的汇编语言语句的gcc扩展 - 这里使用它的属性是能够指定阻止编译器执行某些类型的优化的副作用(在这种情况下可能最终生成不正确的代码)。
需要__volatile__
来确保asm语句本身不与任何其他volatile访问重新排序(C语言中的保证)。
memory
是GCC的一种指令(有点)表示内联asm序列对全局内存有副作用,因此不仅需要考虑对局部变量的影响。
这里的含义如下:
http://en.wikipedia.org/wiki/Memory_ordering
基本上它意味着汇编代码将在您期望的位置执行。 它告诉编译器不要重新排序它周围的指令。 这是在之前执行这段代码之前编码的代码,之后执行的代码将在之后执行。
static inline unsigned long arch_local_irq_save(void)
{
unsigned long flags;
asm volatile(
" mrs %0, cpsr @ arch_local_irq_save\n"
" cpsid i" //disabled irq
: "=r" (flags) : : "memory", "cc");
return flags;
}
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.