[英]gcc-arm Compiler produce different object file for the same source file
使用ARM的GCC編譯器(windows):
arm-none-eabi-gcc.exe(Sourcery CodeBench Lite 2012.09-63)4.7.2版本
我每隔〜5次生成不同的目標文件,我編譯了相同的源文件。
使用優化級別3(激進),使用的編譯器選項:
-O3 -mcpu = cortex-a8 -mfpu = neon -mfloat-abi = softfp -fshort-wchar -fshort-enums -funsafe-math-optimizations -mvectorize-with-neon-quad
轉儲不同的目標文件(使用objdump)顯示在使用的匯編指令,寄存器和地址方面存在太多差異。
編譯器以不同方式優化/編譯完全相同的源文件並生成不同的目標文件是否正常? 它是編譯器錯誤嗎?
如何在不關閉激進優化的情況下避免這種行為?
編輯:對象文件差異片段:
object_file_dump_A:
0000350 <PreInit>:
350: e3003000 movw r3, #0
354: e3403000 movt r3, #0
358: e92d4ff0 push {r4, r5, r6, r7, r8, r9, sl, fp, lr}
35c: e1a09000 mov r9, r0
360: e24dd034 sub sp, sp, #52 ; 0x34
/*some identical ASM for both files */
388: e1a0700b mov r7, fp
38c: e1a0600b mov r6, fp
390: e300a000 movw sl, #0
394: e340a000 movt sl, #0
398: e5911004 ldr r1, [r1, #4]
39c: e8ae0003 stmia lr!, {r0, r1}
object_file_dump_B:
00000350 <PreInit>:
350: e3003000 movw r3, #0
354: e3403000 movt r3, #0
358: e92d4ff0 push {r4, r5, r6, r7, r8, r9, sl, fp, lr}
35c: e1a08000 mov r8, r0
360: e24dd034 sub sp, sp, #52 ; 0x34
/*some identical ASM for both files */
388: e1a0700b mov r7, fp
38c: e3009000 movw r9, #0
390: e3409000 movt r9, #0
394: e5911004 ldr r1, [r1, #4]
398: e8ae0003 stmia lr!, {r0, r1}
39c: e5b30010 ldr r0, [r3, #16]!
編輯:
源代碼 :
void PreInit(init_T *f_params, results_T *results)
{
u8 i, j, k, idx;
const u8 cr_index[4] = {0, 1, 2, 7};
const u8 minVal[] = {2, 4, 6, 0, 0, 0, 0, 19};
const u8 maxVal[] = {0, 3, 5, 0, 0, 0, 0, 18};
memset(f_params, 0, sizeof(init_T));
_ASSERT(CONF_NUM_X_LIMITS == CST_NbSLi);
_ASSERT(CONF_NUM_CRITERIA == CST_NbIdxCriteria);
for (i = 0; i < CST_NbSLi; ++i)
{
f_params->_sli[i].x = s_limits[i];
for (j = 0; j < CST_NbIdxCriteria; ++j)
{
f_params->_sli[i].criteria[j] = conf_criterias[i][j];
}
}
/*some code*/
}
如其他人所述,匯編代碼是等效的。 如果仔細觀察它們,請執行命令
e1a0600b mov r6,fp
它將fp移動到r6,但r6寄存器以后不再使用。 因此,如果我們考慮隨機化策略來分配寄存器和代碼創建,那么變化並不大,在第二部分中,優化會刪除該行。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.