繁体   English   中英

如何使用clang从源文件中提取标头?

[英]How to extract headers from source file using clang?

我正在使用clang ast匹配器从源文件中提取一些信息。 现在,我还想知道源文件正在使用的标头和依赖标头的列表。 例如,源文件abc.c具有以下标头:

#include <def.h>
//#include <def_private.h>

在执行clang匹配程序期间,我需要确保clang知道def.h,它位于同一目录中。 def.h包含以下头文件:

#include <iostream.h>
#include <string.h>
#include <float.h>
#include <math.h>
/*#include <boost>
* #inclde <fstream>*/

我做过匹配器以从abc.c中提取或识别信息。 现在,我想提取所有标题或包含的内容。 这应该包括所有这些:

#include <def.h>
#include <iostream.h>
#include <string.h>
#include <float.h>
#include <math.h>

我进行了一些在线研究,但是不幸的是,所有这些研究都涉及到正则表达式( 从c文件中提取标题名称的正则表达式 )或在Visual Studio中的操作(在Visual Studio中显示C ++文件的#include层次结构 )。

我想知道是否可以使用clang。 另外,请告知我是否还有其他方法可以通过编程方式提取标头,而不仅仅是使用正则表达式。

OP说,除了以正则表达式之外,还有其他任何以编程方式提取标头的方法。 ....没有叮当声是可以的

我们都同意,正则表达式根本无法做到这一点。 您需要将源文本解析为树,并在树中显式显示#include指令。

我不是Clang专家。 我怀疑其内部树反映了经过预处理的源,因此#include构造已消失。 那么问题就在于坚持预处理源文本以对其进行解析。

我们的DMS软件再造工具包及其具有C ++ 17功能的解析器可以在不扩展指令的情况下处理此类解析。 它可以通过两种方式进行操作:a)在相对于源代码“预处理器”指令“结构良好”的情况下,可以将C ++前端配置为捕获解析树,并且这些指令也被解析为适当位置的树; 这在实践中效果很好,但有时需要手动修补特别丑陋的条件或宏调用以使其“结构良好”,或者b)解析捕获以(几乎)任意方式放置的预处理器指令;这捕获了指令有时以自动复制少量代码为代价,实质上会导致情况a)所要求的良好重组。

无论哪种情况,#include指令现在都显式出现在AST中,其中包含的文件几乎被构建为代表包含文件的辅助树。 寻找这种显式包含节点的树木漫步很容易找到此类树节点。 DMS的ASTInterface提供ScanTree遍历节点并在某些提供的谓词为节点为真时采取措施; 检查#include节点很容易。 值得注意的是,因为条件指令也保留了,通过从#include onr树上向上走就可以构造出实际上包含include文件的条件。

当然,头文件本身也会被解析,从而生成一棵树。 任何包含它的东西都已出现在其树体中。 必须在所有这些树上运行ScanTree来收集所有包含文件。

OP没有说他想对#includes做什么。 DMS提供了许多解析之外的方法来帮助OP实现其目的,包括符号表构造,控制和数据流分析,树模式匹配,以源语言(C ++)语法表示的树到树转换以及最终的源代码(重新)从修改后的语法树生成。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM