與 C 中的靜態庫鏈接

Question

嗨，我是 C 和鏈接的初學者，我正在閱讀一本關於與靜態庫鏈接有問題的書：

讓 a 和 b 表示當前目錄中的目標模塊或靜態庫，讓 a→b 表示 a 依賴於 b，因為 b 定義了一個被 a 引用的符號。 對於以下每種情況，顯示允許靜態鏈接器解析所有符號引用的最小命令行（即，具有最少數量的目標文件和庫參數的命令行）：
 po → libx.a → liby.a and liby.a → libx.a →po

而書中給出的答案是：

gcc p.o libx.a liby.a libx.a

我很困惑，答案不應該是：

gcc p.o libx.a liby.a libx.a p.o

否則libx.a的未定義符號如何由po解析？

Answer 1

如果你的 C 教科書沒有說清楚，作者試圖用這個練習來說明的鏈接行為不是 C 標准規定的，實際上是 GNU binutils鏈接器ld行為 - Linux 中的默認系統鏈接器，通常由gcc|g++|gfortran等代表您調用 - 可能但不一定是您可能遇到的其他鏈接器的行為。

如果你准確地給了我們練習，作者可能是一個不太了解靜態鏈接的人，而不是編寫關於它的教科書的最佳人，或者可能只是沒有非常小心地表達自己。

除非我們正在鏈接一個程序，否則默認情況下鏈接器甚至不會堅持解析所有符號引用。 所以大概我們正在鏈接一個程序（不是共享庫），如果答案是：

 gcc p.o libx.a liby.a libx.a

實際上是教科書所說的，那么程序就是它必須的樣子。

但是一個程序必須有一個main函數。 main函數在哪里，它與po 、 libx.a和liby.a鏈接關系是什么？ 這很重要，我們沒有被告知。

所以讓我們假設p代表program ，並且 main 函數至少在po定義。 奇怪的是，雖然liby.a依賴於po ，其中po是程序的主要對象模塊，但在靜態庫的成員中定義main函數會更奇怪。

假設這么多，這里有一些源文件：

個人電腦

#include <stdio.h>

extern void x(void);

void p(void)
{
    puts(__func__);
}

int main(void)
{
    x();
    return 0;
}

xc

#include <stdio.h>

void x(void)
{
    puts(__func__);
}

yc

#include <stdio.h>

void y(void)
{
    puts(__func__);
}

呼叫中心

extern void x(void);

void callx(void)
{
    x();
}

呼叫.c

extern void y(void);

void cally(void)
{
    y();
}

調用程序

extern void p(void);

void callp(void)
{
    p();
}

將它們全部編譯為目標文件：

 $ gcc -Wall -Wextra -c p.c x.c y.c callx.c cally.c callp.c

並制作靜態庫libx.a和liby.a ：

$ ar rcs libx.a x.o cally.o callp.o
$ ar rcs liby.a y.o callx.o

現在， po 、 libx.a和liby.a滿足練習的條件：

 p.o → libx.a → liby.a and liby.a → libx.a →p.o

因為：

po指但不定義x ，它在libx.a定義。
libx.a定義了cally ，它引用但不定義y ，它在liby.a定義
liby.a定義了callx ，它引用但不定義x ，它在libx.a定義。
libx.a定義了callp ，它引用但不定義p ，它在po定義。

我們可以用nm確認：

 $ nm p.o
 0000000000000000 r __func__.2252
                  U _GLOBAL_OFFSET_TABLE_
 0000000000000013 T main
 0000000000000000 T p
                  U puts
                  U x

po定義p ( = T p ) 並引用x ( = U x )

$ nm libx.a

x.o:
0000000000000000 r __func__.2250
                 U _GLOBAL_OFFSET_TABLE_
                 U puts
0000000000000000 T x

cally.o:
0000000000000000 T cally
                 U _GLOBAL_OFFSET_TABLE_
                 U y

callp.o:
0000000000000000 T callp
                 U _GLOBAL_OFFSET_TABLE_
                 U p

libx.a定義x ( = T x ) 和引用y ( = U y ) 和引用p ( = U p )

$ nm liby.a

y.o:
0000000000000000 r __func__.2250
                 U _GLOBAL_OFFSET_TABLE_
                 U puts
0000000000000000 T y

callx.o:
0000000000000000 T callx
                 U _GLOBAL_OFFSET_TABLE_
                 U x

liby.a定義y ( = T y ) 並引用x ( = U x )

現在教科書的聯動肯定成功了：

$ gcc p.o libx.a liby.a libx.a
$ ./a.out
x

但它是最短的鏈接嗎？ 不，這是：

$ gcc p.o libx.a
$ ./a.out
x

為什么？ 讓我們重新運行與診斷的鏈接，以顯示實際鏈接了哪些目標文件：

$ gcc p.o libx.a -Wl,-trace
/usr/bin/ld: mode elf_x86_64
/usr/lib/gcc/x86_64-linux-gnu/7/../../../x86_64-linux-gnu/Scrt1.o
/usr/lib/gcc/x86_64-linux-gnu/7/../../../x86_64-linux-gnu/crti.o
/usr/lib/gcc/x86_64-linux-gnu/7/crtbeginS.o
p.o
(libx.a)x.o
libgcc_s.so.1 (/usr/lib/gcc/x86_64-linux-gnu/7/libgcc_s.so.1)
/lib/x86_64-linux-gnu/libc.so.6
(/usr/lib/x86_64-linux-gnu/libc_nonshared.a)elf-init.oS
/lib/x86_64-linux-gnu/ld-linux-x86-64.so.2
/lib/x86_64-linux-gnu/ld-linux-x86-64.so.2
libgcc_s.so.1 (/usr/lib/gcc/x86_64-linux-gnu/7/libgcc_s.so.1)
/usr/lib/gcc/x86_64-linux-gnu/7/crtendS.o
/usr/lib/gcc/x86_64-linux-gnu/7/../../../x86_64-linux-gnu/crtn.o

他們是：

 p.o
 (libx.a)x.o

po首先鏈接到程序中，因為輸入.o文件總是無條件鏈接的。

然后是libx.a 。 閱讀靜態庫以了解鏈接器如何處理它。 鏈接po ，它只有一個未解析的引用 - 對x的引用。 它檢查libx.a尋找定義x的目標文件。 它找到(libx.a)xo 。 它從libx.a提取xo並鏈接它，然后就完成了。 ¹

所有涉及liby.a的依賴關系：-

(libx.a)cally.o依賴於(liby.a)yo
(liby.a)callx.o依賴於(libx.a)xo

是無關的聯動，因為聯動不需要任何目標文件liby.a 。

鑒於作者所說的是正確答案，我們可以對他們試圖陳述的練習進行逆向工程。 就是這個：

定義main的對象模塊po引用了它沒有定義的符號x ，而x在靜態庫libxz.a成員xo中定義
(libxz.a)xo指的是它沒有定義的符號y ，而y是在靜態庫liby.a成員yo中定義的
(liby.a)yo指的是它沒有定義的符號z ，而z在libxz.a成員zo中libxz.a 。
(liby.a)yo指的是它沒有定義的符號p ，而p是在po定義的
使用po 、 libxz.a 、 liby.a的最小鏈接命令是什么？

新的源文件：

個人電腦

Stays as before.

xc

#include <stdio.h>

extern void y();

void cally(void)
{
    y();
}

void x(void)
{
    puts(__func__);
}

yc

#include <stdio.h>

extern void z(void);
extern void p(void);

void callz(void)
{
    z();
}

void callp(void)
{
    p();
}

void y(void)
{
    puts(__func__);
}

零點

#include <stdio.h>

void z(void)
{
    puts(__func__);
}

新的靜態庫：

$ ar rcs libxz.a x.o z.o
$ ar rcs liby.a y.o

現在鏈接：

$ gcc p.o libxz.a
libxz.a(x.o): In function `cally':
x.c:(.text+0xa): undefined reference to `y'
collect2: error: ld returned 1 exit status

失敗，就像：

$ gcc p.o libxz.a liby.a
liby.a(y.o): In function `callz':
y.c:(.text+0x5): undefined reference to `z'
collect2: error: ld returned 1 exit status

和：

$ gcc p.o liby.a libxz.a
libxz.a(x.o): In function `cally':
x.c:(.text+0xa): undefined reference to `y'
collect2: error: ld returned 1 exit status

和（您自己的選擇）：

$ gcc p.o liby.a libxz.a p.o
p.o: In function `p':
p.c:(.text+0x0): multiple definition of `p'
p.o:p.c:(.text+0x0): first defined here
p.o: In function `main':
p.c:(.text+0x13): multiple definition of `main'
p.o:p.c:(.text+0x13): first defined here
libxz.a(x.o): In function `cally':
x.c:(.text+0xa): undefined reference to `y'
collect2: error: ld returned 1 exit status

因未定義引用錯誤和多重定義錯誤而失敗。

但是教科書的答案是：

$ gcc p.o libxz.a liby.a libxz.a
$ ./a.out
x

現在是對的。

作者試圖描述一個程序鏈接中兩個靜態庫之間的相互依賴，但發現這種相互依賴只有在鏈接需要每個庫中至少有一個引用某個符號的目標文件時才能存在。由另一個庫中的目標文件定義。

從修正后的練習中要吸取的教訓是：

出現在鏈接器輸入中的目標文件foo.o永遠不需要出現多次，因為它將被無條件鏈接，並且當它被鏈接時，它提供的任何符號s的定義將用於解析對s所有引用任何其他鏈接器輸入的累積。 如果foo.o被輸入兩次，你只能得到s多重定義的錯誤。
但是如果鏈接中的靜態庫之間存在相互依賴關系，則可以通過兩次輸入其中一個庫來解決。 因為目標文件是從靜態庫中提取並鏈接的，當且僅當需要該目標文件來定義鏈接器在輸入庫時試圖定義的未解析符號引用時。 所以在更正的例子中：
- po是輸入並無條件鏈接。
- x成為未解析的引用。
- libxz.a是輸入。
- x的定義可以在(libxz.a)xo 。
- (libxz.a)xo被提取和鏈接。
- x已解決。
- 但是(libxz.a)xo指的是y 。
- y成為未解析的引用。
- liby.a是輸入。
- y的定義可以在(liby.a)yo 。
- (liby.a)yo被提取和鏈接。
- y已解決。
- 但是(liby.a)yo指的是z 。
- z成為未解析的參考。
- 再次輸入libxz.a 。
- 在libxz.a(zo)可以找到z的定義
- libxz.a(zo)被提取和鏈接。
- z已解決。

[1] 正如-trace輸出所示，嚴格來說，直到(libx.a)xo之后的所有樣板也被鏈接后，鏈接才完成，但對於每個 C 程序鏈接，它都是相同的樣板。

與 C 中的靜態庫鏈接

問題描述

1 個解決方案

解決方案1
1 已采納 2018-11-05 20:17:23

與 C 中的靜態庫鏈接

問題描述

1 個解決方案

解決方案1 1 已采納 2018-11-05 20:17:23

解決方案1
1 已采納 2018-11-05 20:17:23