[英]What exactly is in a .o / .a / .so file?
我想知道在编译C ++程序时,.o或.so文件中存储的确切内容。 这篇文章给出了编译过程的一个相当不错的概述,并在其.o文件的功能,而据我了解,从这个帖子 ,u和.so文件只是多个.o文件合并成一个单一的文件,以静态(.a)或动态(.so)方式链接。
但我想检查一下我是否正确理解了这样一个文件中存储的内容。 编译以下代码后
void f();
void f2(int);
const int X = 25;
void g() {
f();
f2(X);
}
void h() {
g();
}
我希望在.o文件中找到以下项目:
g()
机器代码,包含一些占位符地址,其中调用f()
和f2(int)
。 h()
机器代码,没有占位符 X
机器代码,只是数字25
g()
, h()
和X
f()
和f2(int)
,这些符号必须在链接期间解析。 然后像nm
这样的程序会列出两个表中的所有符号名称。
我想编译器可以通过调用f2(25)
来优化调用f2(X)
,但它仍然需要将符号X保存在.o文件中,因为无法知道它是否会被用于不同的.o文件。
那会是正确的吗? .a和.so文件是否相同?
谢谢你的帮助!
你对目标文件的一般想法非常正确。 在“指定文件中的哪些地址的表”中,我将“地址”替换为“偏移”,但这只是措辞。
.a文件只是简单的存档(一种早于tar的旧格式,但做同样的事情)。 你可以用tar文件替换.a文件,只要你教导链接器解压缩它们并且只链接它们中包含的所有.o文件(或多或少,有一些逻辑不能链接到目标文件中)存档不是必需的,但这只是一个优化)。
.so文件不同。 它们比目标文件更接近最终二进制文件。 解析了所有符号的.so文件至少在理论上可以作为程序运行。 事实上,对于PIE(位置无关的可执行文件),共享库和程序之间的差异(至少在理论上)只是标题中的几个位。 它们包含动态链接器如何加载库的指令(或多或少与正常程序相同的指令)和包含指令的重定位表,告诉动态链接器如何解析外部符号(同样,在程序中) 。 动态库(和程序)中的所有未解析符号都是通过间接表访问的,这些表在动态链接时填充(程序启动或dlopen
)。
如果我们对此进行了简化,那么对象和共享库之间的区别在于,共享库中已经完成了更多的工作而不进行文本重定位(这不是严格必要和强制执行的,但这是一般的想法)。 这意味着在目标文件中,汇编程序只生成了链接器随后填充的地址的占位符,对于共享库,地址填充了跳转表的地址,以便不需要更改库的文本,只有有限的跳转表。
顺便说一句。 我在说ELF。 较旧的格式在程序和库之间存在更多差异。
您在问题中描述的内容(函数,初始化数据和重定位表的机器代码)几乎就是.o(对象)和.so(共享对象)文件。
.a(档案)基本上是多个.o(对象)文件聚集在一起,以便在链接期间更容易参考。 (“链接库”)
.so(共享对象)文件包含一些额外的元数据,就像其他 .so一样需要链接。(xyz.so可能引用一些驻留在abc.so中的函数,以及abc.so需要的信息链接,加上可选的路径,在哪里找到abc.so(RPATH),需要在xyz.so中编码。)
Windows .dll(动态链接库)文件基本上是具有不同名称的共享对象(.so)。
免责声明:这显着简化了事情,但与“The Truth(tm)”足够接近,以满足日常开发人员的需求。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.