3

我正在用 C(Linux 操作系统)编程。我必须读取一个文件,检查该文件中的函数并打印相应的函数名称。到目前为止,我已经编程使用'{'的深度计算来识别函数。我知道__FUNCTION__预处理器指令用于打印当前文件的函数名。同样,是否有任何预处理器指令用于查找我们读取的文件的函数名称?我不关心任何特定的工具。我想让它编程。请指导我。提前致谢。

我试图实现这段代码。这个函数将行(在'{'之前)作为参数。

void ffname(char line[100])
{
    int i,j,m,n,f=0;
    char dt[10],fname[28];
    char s[5][10]={"int","void","struct","char","float"};
    dt = strtok(line," ");
    for(i=0;i<5;i++)
    {
        m=strcmp(dt,s[i]);
        if(m==0)
        {
            f=1;
            n=strlen(dt);
        }
    }
    if(f)
    {
        for(i=n+2,j=0;i<strlen(line);i++,j++)
        {
            if(line[i] == '*')
                i++;
            while(line[i] != '(')
            {
                fname[j]=line[i];
            }  
        }
    }
}

我不知道这段代码是否正确。我要这样使用吗?有没有找到函数名的选项?

4

9 回答 9

3

我假设您正在阅读的文件是 C 源文件。

如果您想正确地完成它(意味着,如果您想要可靠地识别所有功能),这不是一项微不足道的任务。有关更多信息,请参阅列出 C/C++ 函数(Unix 中的代码分析)

我不关心任何特定的工具。我想让它编程。

这当然是可能的,但你最终会得到一个 C 的扫描器/解析器前端,类似于DoxygenSynopsis等工具中已经实现的。您可能可以稍微简化一下并使用一些启发式方法,例如您不需要解析完整的代码(例如,您可以跳过 和 之间的任何内容{}

如果您仍想实现自己的方法,我将按照以下步骤操作:

  • 在任何情况下,您都应该首先通过 C 预处理器运行您的 C 文件,以解析任何宏并使原始 C 代码可用。
  • 然后熟悉基本的编译器构造技术,尤其是扫描和解析源文件以及 C 语法。请注意,有不同的语法,具体取决于您使用的 C 版本。例如,ISO/IEC 9899:TC2,附录 A1包含 C99 的语法。查看上述工具的源代码也应该有所帮助。
  • 实现一个扫描器来标记您的输入,并实现一个识别函数名称的解析器。从我之前提到的语法来看,(6.9.1) function-definition是你应该开始的生产术语。
于 2012-12-17T06:41:10.443 回答
3

我使用简单的 C 代码来查找函数的名称。

#include <stdio.h>
#include <string.h>

#define SIZE 1024
void ffname(char *line)
{
    int i=1,j=0;
    char *dt; 
    char name[SIZE];
    strtok(line,"("); 
    dt = strchr(line,' '); 
    if(dt[i] == '*')
        i++;
    while(dt[i] != '\0')
    {
        name[j]=dt[i];
        i++;
        j++;
    }
    name[j] ='\0';
    printf("Function name is: %s\n", name);
}

int main(int argc, char **argv)
{
    if(argc < 2)
    {
        printf("Give the filename \n");
        printf("Usage: %s filename\n", argv[0]);
        return -1;
    }
    int i, lines =0, funlines =0,count =0, fn =0, flag =0;
    char c[SIZE],b[SIZE];
    FILE *fd;
    fd = fopen(argv[1],"r");
    while(fgets(c,SIZE,fd))
    {   
        lines++;
        i=0;
        for(i=0;i<strlen(c);i++)
        {
            while( c[i] =='\t' || c[i] == ' ')
            {
                i++;
            }
            if( c[i] == '{')
            {
                count++;
                if(flag)
                {
                    funlines++;
                }
                if(count == 1)
                {
                    fn++;
                    printf("Function %d is Started..............\n", fn); 
                    flag = 1;
                    ffname(b);
                }
                break;
            }
            else if( c[i] == '}')
            {
                count--;
                if(!count)
                { 
                    flag = 0;
                    printf("No of lines in the function %d is: %d\n", fn, funlines);
                    printf("Function %d is finished..........\n", fn);
                    funlines = 0;
                }
                else
                {
                    funlines++;
                }
                break;
            }
            else if(flag)
            {
                funlines++;
                break;
            }
        }
        strcpy(b,c);
    }
    printf("Total no of function%d\n",fn);
    printf("Total no of lines%d\n",lines);
    return 0;
}
于 2012-12-19T06:53:03.473 回答
1

这很难正确地做到。基本上,您需要实现 ac 编译器才能正确执行此操作。这正是 c 编译器所做的,并且需要适当的语法定义和预处理器来执行此操作。

于 2012-12-17T06:38:23.790 回答
1

为 C 编写解析器很困难(不是不可能,很困难),仅仅是因为 C 支持这么多语法。

您可以使用定义一个函数

  1. 标准 C 样式,具有标准返回类型
  2. 标准 C 风格,具有 typedef/enum 等返回类型(不能用简单的解析器轻松识别。您需要在文件中构建用户定义数据类型的数据库)
  3. C 宏(例如参考 Basile 的回答
  4. 汇编(通过解析一个非常简单的 test.cgcc -S来了解语法)我已经使用这种方法创建了一些占位符函数。

因此,您可以更轻松地解析汇编文件,而不是解析 C 文件。

例如gcc -S,将 C 函数定义翻译如下:

    .globl  someFnName
    .type   someFnName, @function
someFnName:
    ...function-body related code...

如果您只想要函数名称列表(即不需要参数/返回值等),与 C 文件相比,您可以轻松地在汇编中解析上述 3 行代码。
如果您还添加-g开关,-s您还将获得一些行号信息。

好处:

  1. 比 C 文件更容易解析
  2. 负责定义函数的大多数(如果不是全部)方法。
  3. 根据“ .globl someFnName”行是否存在,您可以隔离静态功能。

坏处:

  1. 需要外部解析器 - gcc 或其他
  2. 需要编译器 (gcc) 依赖的辅助解析器
  3. 可能会给出一些误报
于 2012-12-17T09:11:12.280 回答
1

我认为flex并且bison会帮助你解决你的问题,这里有一些链接:c grammar(lex) , c grammar(bison)

于 2012-12-17T09:26:36.330 回答
1

简单的方法,如果您愿意做一些假设,请阅读源代码,然后:

  • 删除任何 preprosessor 指令(假设您不希望包含文件中的函数,并且不想处理#define可能与函数相关的任何不稳定的宏,请注意 multiline在行尾#define继续)。\

  • 删除所有评论(注意嵌套/*评论)。

  • 将任何字符串转换为""(注意转义\"和多行字符串)。

  • 将任何字符转换为' '或其他东西(摆脱'{'等,小心转义\'和其他转义)。

  • 将所有(嵌套、多行)代码块转换为“顶级”{}对。

  • ;重新格式化文本以仅在and之后有换行符},除非将一行中的一个单独;的行连接到上一行,以防它实际上是其中的一部分};而不是函数定义。

  • 删除所有以;

除非我遗漏了什么,现在你应该留下所有的函数定义,每行一个,函数体替换为{}.

于 2012-12-17T13:35:13.060 回答
0

我认为您可以尝试 使用正则表达式来查找目标函数名称是否存在。

你可以在这篇文章中找到更多关于正则表达式的信息。C中的正则表达式:示例?

于 2012-12-17T06:21:09.047 回答
0

你读什么样的文件?它是一些任意的 C 源文件吗?如果是,它可以用许多不同的方式定义函数,例如通过预处理器宏。例如与

#define DF(Nam) void Nam##print(void) {puts(#Nam);}

一个 C 文件可能已经DF(foo)定义了这个函数(在源代码中 fooprint没有出现)。fooprint

如果您想处理编译器看到的一组函数名称,最好开发一个编译器扩展或插件。使用 GCC,您可以为此目的使用MELT (一种扩展 GCC 的领域特定语言)。

如果要查找某个目标文件定义的 [global] 函数*.o,可以nm在 Linux 上使用该命令。也许还考虑dlopen(3) -ing 共享目标文件*.so

当然,所有这些都可能是编译器和系统特定的。

于 2012-12-17T06:24:16.277 回答
0

如果您可以使用 gcc:

gcc -nostdinc -aux-info output demo.c

仅输出文件函数(不包括标准库)

注意:-nostdinc 导致编译错误

您可以使用 sed 避免编译错误

gcc -aux-info output demo.c
sed '/include/d' output
于 2012-12-17T10:11:27.803 回答