簡體   English   中英

為什么vs c ++ 2010編譯器為類似函數生成不同的匯編代碼

[英]why does vs c++ 2010 compiler produce a different assembly code for similar function

所以最近我考慮strcpy並回到K&R,他們將實現顯示為

while (*dst++ = *src++) ;

但是我錯誤地把它轉錄為:

while (*dst = *src)
{
    src++; //technically could be ++src on these lines
    dst++; 
}

在任何情況下,讓我思考編譯器是否真的會為這兩個代碼生成不同的代碼。 我最初的想法是它們應該幾乎相同,因為src和dst正在增加但從未使用過我認為編譯器會知道不會嘗試在生成的機器代碼中將它們作為“變量”進行實際保存。

在32位發布模式(/ O2)中使用帶有VS 2010 C ++ SP1構建的windows7,我獲得了上述兩種版本的反匯編代碼。 為了防止函數本身直接引用輸入並進行內聯,我使用每個函數創建了一個dll。 我省略了制作的ASM的序幕和尾聲。

    while (*dst++ = *src++)
6EBB1003 8B 55 08             mov         edx,dword ptr [src]     
6EBB1006 8B 45 0C             mov         eax,dword ptr [dst]     
6EBB1009 2B D0                sub         edx,eax                //prepare edx so that edx + eax always points to src     
6EBB100B EB 03                jmp         docopy+10h (6EBB1010h)  
6EBB100D 8D 49 00             lea         ecx,[ecx]              //looks like align padding, never hit this line
6EBB1010 8A 0C 02             mov         cl,byte ptr [edx+eax]  //ptr [edx+ eax] points to char in src  :loop begin
6EBB1013 88 08                mov         byte ptr [eax],cl      //copy char to dst
6EBB1015 40                   inc         eax                    //inc src ptr
6EBB1016 84 C9                test        cl,cl                  // check for 0 (null terminator)
6EBB1018 75 F6                jne         docopy+10h (6EBB1010h)  //if not goto :loop begin
        ;

上面我注釋了代碼,基本上是一個循環,只有1個檢查null和1個內存副本。

現在讓我們來看看我的錯誤版本:

    while (*dst = *src)
6EBB1003 8B 55 08             mov         edx,dword ptr [src]  
6EBB1006 8A 0A                mov         cl,byte ptr [edx]  
6EBB1008 8B 45 0C             mov         eax,dword ptr [dst]  
6EBB100B 88 08                mov         byte ptr [eax],cl       //copy 0th char to dst
6EBB100D 84 C9                test        cl,cl                   //check for 0
6EBB100F 74 0D                je          docopy+1Eh (6EBB101Eh)  // return if we encounter null terminator
6EBB1011 2B D0                sub         edx,eax  
6EBB1013 8A 4C 02 01          mov         cl,byte ptr [edx+eax+1]  //get +1th char  :loop begin
    {
        src++;
        dst++;
6EBB1017 40                   inc         eax                   
6EBB1018 88 08                mov         byte ptr [eax],cl        //copy above char to dst
6EBB101A 84 C9                test        cl,cl                    //check for 0
6EBB101C 75 F5                jne         docopy+13h (6EBB1013h)   // if not goto :loop begin
    }

在我的版本中,我看到它首先將第0個字符復制到目標,然后檢查null,然后最后進入循環,再次檢查null。 所以循環基本保持不變,但現在它處理循環前的第0個字符。 與第一種情況相比,這當然是次優的。

我想知道是否有人知道為什么編譯器被阻止與第一個例子制作相同(或接近相同)的代碼。 這是ms編譯器特定問題還是可能與我的編譯器/鏈接器設置有關?


這里是完整的代碼,2個文件(1個函數替換另一個)。

// in first dll project
__declspec(dllexport) void docopy(const char* src, char* dst)
{
    while (*dst++ = *src++);
}

__declspec(dllexport) void docopy(const char* src, char* dst)
{
    while (*dst = *src)
    {
        ++src;
        ++dst;
    }
}


//seprate main.cpp file calls docopy
void docopy(const char* src, char* dst);
char* source ="source";
char destination[100];
int main()
{

    docopy(source, destination);
}

因為在第一個示例中,即使src開始指向空字符,也會始終發生后遞增。 在相同的起始情況下,第二個示例不會增加指針。

當然編譯器還有其他選擇。 “復制第一個字節然后進入循環,如果不是0”是gcc-4.5.1用-O1產生的。 使用-O2和-O3,它會產生

.LFB0:
    .cfi_startproc
    jmp     .L6             // jump to copy
    .p2align 4,,10
    .p2align 3
.L4:
    addq    $1, %rdi        // increment pointers
    addq    $1, %rsi
.L6:                        // copy
    movzbl  (%rdi), %eax    // get source byte
    testb   %al, %al        // check for 0
    movb    %al, (%rsi)     // move to dest
    jne     .L4             // loop if nonzero
    rep
    ret
    .cfi_endproc

這與它為K&R循環產生的非常相似。 這實際上是否更好,我不能說,但它看起來更好。

除了跳轉到循環之外,K&R循環的指令完全相同,只是采用不同的順序:

.LFB0:
    .cfi_startproc
    .p2align 4,,10
    .p2align 3
.L2:
    movzbl  (%rdi), %eax    // get source byte
    addq    $1, %rdi        // increment source pointer
    movb    %al, (%rsi)     // move byte to dest
    addq    $1, %rsi        // increment dest pointer
    testb   %al, %al        // check for 0
    jne     .L2             // loop if nonzero
    rep
    ret
    .cfi_endproc

你的第二個代碼不“再次檢查null”。 在你的第二個版本中,循環體使用edx+eax+1地址處的字符(注意+1部分),這將是字符編號1,2,3等等。 序言代碼使用字符編號0.這意味着代碼永遠不會檢查相同的字符兩次,正如您似乎相信的那樣。 那里沒有“再次”。

第二個代碼是一個更復雜的機器人(循環的第一次迭代被有效地從中抽出),因為已經解釋過它的功能是不同的。 指針的最終值在您的拳頭和第二個版本之間有所不同。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM