12

我最近开始使用 libclang 来解析 C 文件。我遇到的问题显然是,libclang 在生成 AST 之前启动了预处理器。我想禁止预处理器运行,而是获得预处理器指令在文件中的信息......

我使用以下 python 脚本(cindex.py 和 libclang)

import codecs
from clang.cindex import *

class SourceFile(object):
    def __init__(self, path):
        with codecs.open(path, 'r', 'utf-8') as file:
            self.file_content = file.read()

        index = Index.create()
        root_node = index.parse(path)

        for included in root_node.get_includes():
            print included.include

        self.print_declerations(root_node.cursor)

    def print_declerations(self, root, recurse=True):
        print root.kind.name, root.spelling
        if root.kind.is_declaration():
            node_def = root.get_definition()
            if node_def is not None:
                start_offset = node_def.extent.start.offset
                end_offset = node_def.extent.end.offset + 1
                print self.file_content[start_offset:end_offset], '\n'

        if recurse:
            for child in root.get_children():
                self.print_declerations(child, False)

if __name__ == '__main__':
    path = 'Sample.cpp'
    print 'Translation unit:', path
    source = SourceFile(path)

哪个输出

Translation unit: Sample.cpp
/mingw/include\stdio.h
/mingw/include\_mingw.h
/mingw/include\sys/types.h
TRANSLATION_UNIT None
TYPEDEF_DECL __builtin_va_list

STRUCT_DECL _iobuf

TYPEDEF_DECL FILE

VAR_DECL _iob
UNEXPOSED_DECL 

FUNCTION_DECL main
int main()
{
    printf(HELLO_WORLD);
    return 0;
}

对于以下 C 代码:

#include <stdio.h>
#define HELLO_WORLD "HELLO!"

int main()
{
    printf(HELLO_WORLD);
    return 0;
}

我想要的是在代码中为我的#define 获取 DEFINE_DECL HELLO_WORLD(目前我什么也得不到)。当然,我的#include 也有类似的声明。这可能吗?

编辑:基本上,我想在没有扩展预处理器指令的情况下解析文件。

4

3 回答 3

29

如果您将 PARSE_DETAILED_PROCESSING_RECORD 作为选项添加到对 index.parse() 的调用中,您将可以访问预处理器节点。

index = clang.cindex.Index.create()                                                                         
tu = index.parse(filename, options=clang.cindex.TranslationUnit.PARSE_DETAILED_PROCESSING_RECORD)

此选项映射到以下 libclang C API 选项值。那里有一条评论,其中包含更多上下文。

/**                                                                         
 * \brief Used to indicate that the parser should construct a "detailed"    
 * preprocessing record, including all macro definitions and instantiations.
 *                                                                          
 * Constructing a detailed preprocessing record requires more memory        
 * and time to parse, since the information contained in the record         
 * is usually not retained. However, it can be useful for                   
 * applications that require more detailed information about the            
 * behavior of the preprocessor.                                            
 */                                                                         
CXTranslationUnit_DetailedPreprocessingRecord = 0x01,   
于 2013-08-08T17:25:42.407 回答
4

几天前,我在#llvm freenode irc 频道上问了同样的问题。答案是“macroses 不是 AST 的一部分,所以你不能”,但很可能是“-fsyntax-only”选项和 clang 插件而不是 libclang 可能会帮助你。

编辑:看起来现在实际上是可能的,请参阅 bradtgmurray 的回答

于 2012-12-30T17:45:10.517 回答
1

如果您使用命令行参数作为调用 libclang 的一种方式,这里是来自 libclang C API 实现的相关代码:

// Do we need the detailed preprocessing record?
if (options & CXTranslationUnit_DetailedPreprocessingRecord) {
  Args->push_back("-Xclang");
  Args->push_back("-detailed-preprocessing-record");
}
于 2016-01-29T06:00:22.410 回答