0

我是新手。我想使用 flex/bison 解析 bibtex 文件。一个示例 bibtex 是:

@Book{a1,
author="amook",
Title="ASR",
Publisher="oxf",
Year="2010",
Add="UK",
Edition="1",
}
@Article{a2,
Author="Rudra Banerjee",
Title={FeNiMo},
Publisher={P{\"R}B},
Issue="12",
Page="36690",
Year="2011",
Add="UK",
Edition="1",
}

为了解析这个,我编写了以下代码:

%{
#include <stdio.h>
#include <stdlib.h>
%}

%{
char yylval;
int YEAR,i;
//char array_author[1000];
%}
%x author
%x title
%x pub
%x year
%%
@                               printf("\nNEWENTRY\n");
[a-zA-Z][a-zA-Z0-9]*            {printf("%s",yytext);
                                        BEGIN(INITIAL);}
author=                         {BEGIN(author);}
<author>\"[a-zA-Z\/.]+\"        {printf("%s",yytext);
                                        BEGIN(INITIAL);}
year=                           {BEGIN(year);}
<year>\"[0-9]+\"                {printf("%s",yytext);
                                        BEGIN(INITIAL);}
title=                          {BEGIN(title);}
<title>\"[a-zA-Z\/.]+\"         {printf("%s",yytext);
                                        BEGIN(INITIAL);}
publisher=                      {BEGIN(pub);}
<pub>\"[a-zA-Z\/.]+\"           {printf("%s",yytext);
                                        BEGIN(INITIAL);}
[a-zA-Z0-9\/.-]+=        printf("ENTRY TYPE ");
\"                      printf("QUOTE ");
\{                      printf("LCB ");
\}                      printf(" RCB");
;                       printf("SEMICOLON ");
\n                      printf("\n");
%%

int main(){
  yylex();
//char array_author[1000];
//printf("%d%s",&i,array_author[i]);
i++;
return 0;
}

问题是我想将不同变量中的 key 和 val 分开并将其存储在某个地方(可能是数组)。我可以有一些见解吗?

4

1 回答 1

0

如果我在一年前看到这个问题,我会同时发表评论,以便可以改进这个问题。提供的代码不是解析器,而是仅针对 flex 编码的正则表达式。使用正则表达式扫描输入文件中的标记只是构建解析器的一部分。bibtex 文件的语法或结构尚未为 bison 定义。

要分离 key 和 val,如果这就是所需要的,那么使用 awk 和 sed 之类的工具比使用 flex 更容易完成。我要指出的一件事是 vals 总是遵循等号。Kinda 使它们很容易识别,而无需任何特殊的句法诡计。

由于我们没有关于为什么我们需要解析 bibtex 文件的信息,而且练习的最终目标很难看出什么是最好的方法。

编辑:这个问题是重复的,因为 OP 再次询问它并得到了回答:parse bibtex with flex+bison: revisited

于 2015-02-18T23:04:47.517 回答