繁体   English   中英

调用@plt函数时,在dlopen / static init上共享库SIGSEGV

[英]Shared library SIGSEGV on dlopen / static init when calling @plt function

我的应用程序使用静态初始化代码调整库。 所有其他库都做同样的事情并且之前加载得很好,但是当从另一个库调用函数时,这个库就会死掉。 这类似于:

0x12311 <-- bad address
_static_initialization_0 <-- function call
....
dlopen

现在,反汇编中的函数调用看起来像

call _Z6MyFuncRA37_Kc@plt

但是,此调用最终调用无效地址0x12311,即PLT条目获取错误的地址。

问题很可能是所讨论的库是第三方库,即使它依赖于其他库,它以二进制预构建形式出现。 上周我们做了一个很大的优化,并改变了很多标题,等等。 PLT错误的函数MyFunc位于我们的(另一个)库中,它进行了大量的优化更改。

这怎么可能? 确切的问题是:

  1. 什么是导致PLT不匹配的机制
  2. 有没有办法解决它而不触及预编译库 - 可选,因为我可以获得重建版本,但我仍然好奇为什么它崩溃

此外,使用-O2优化编译时,相同的应用程序工作正常,这就是我所说的奇怪(二进制库在两种情况下都相同)。

PS ubuntu 12.04 x86_64但应用程序是i386。

更新:注释中的建议(由于某种原因删除)检查LD_DEBUG是好的,在LD_DEBUG =绑定中我在app的“崩溃”版本中看到了这一点:

 10272:  /media/EXT/work/build32/bin/libMyLib.so: error: 
    symbol lookup error: undefined symbol: omp_set_num_threads (fatal)

然后它会停止绑定libMyLib.so符号,而在非失败版本中它会保持绑定其他符号。 但我不明白为什么它继续执行并尝试加载父库。 实际上该计划如下:

libA -> libB -> libMyLib

libMyLib失败(如上面的LD_DEBUG输出所示),因此它会跳过它并完全跳过libB(!)并继续绑定libA符号。 非失败版本完全加载libMyLib符号,然后继续使用libB符号,然后使用libA符号。

坦率地说,它看起来像ld bug。

至于为什么优化版本工作,我想omp_方法并不是真正需要的,并且被链接器优化抛出,因此它在运行时找不到它。

这是我在LD_DEBUG中看到的=在找不到libC的omp_符号后的所有日志:

19225: symbol=omp_set_num_threads; lookup in file=/usr/lib/i386-linux-gnu/libXdmcp.so.6 [0]
19225: /media/EXT/Work/libC.so: error: symbol lookup error: undefined symbol: omp_set_num_threads (fatal)
19225:
19225: file=/media/EXT/libA.so [0]; destroying link map
19225:
19225: file=/media/EXT/libA.so [0]; dynamically loaded by /media/EXT/libX.so [0]
19225: file=/media/EXT/libA.so [0]; generating link map
19225: dynamic: 0xf2fdb764 base: 0xf2f81000 size: 0x00064a28
19225: entry: 0xf2f8ffd0 phdr: 0xf2f81034 phnum: 7
19225:
19225: checking for version `GCC_3.0' in file /lib/i386-linux-gnu/libgcc_s.so.1 [0] required by file /media/EXT/libA.so [0]
... few more checking
19225: object=/media/EXT/libA.so [0]
19225: scope 0: bin/mainapp /lib/i386-linux-gnu/libpthread.so.0 /media/EXT/libX.so ...
19225: scope 1:...
19225:
19225:
19225: relocation processing: /media/EXT/libA.so
19225: symbol=_ZTVN10__cxxabiv117__class_type_infoE; lookup in file=bin/mainapp [0]
19225: symbol=_ZTVN10__cxxabiv117__class_type_infoE; lookup in file=/lib/i386-linux-gnu/libpthread.so.0 [0]
19225: symbol=_ZTVN10__cxxabiv117__class_type_infoE; lookup in file=/media/EXT/libX.so [0]
19225: binding file /media/EXT/libA.so [0] to /media/EXT/libX.so [0]: normal symbol `_ZTVN10__cxxabiv117__class_type_infoE'

... here it continues to bind libA symbols, and after finishing that

19225:
19225:
19225: calling init: /media/EXT/libC.so
19225:

它为非初始化的libC.so模块调用init。

(只是提到libX.so是调用dlopen的基本模块,还包含所有其他库使用的基本方法。)

在销毁了libA的链接映射后,日志显示它再次生成,我只是不明白加载器是否继续加载libA或者这次从头开始而不打扰libB / libC。 好吧,它在任何情况下都会忽略libB / libC,直到为libC调用init。

omp_set_num_threads与GCC内部的OpenMP支持有关。

你或许应该通过-fopenmp标志在编译和链接时间与gcc(即使你只是dlopen -ing使用OpenMP库)。

也许原来的图书馆提供商忘记了。

(OpenMP正在改变编译过程的整个行为)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM