0

我是 Lex 和 Yacc 的新手。我尝试学习语法规则和语义动作。我试图编写一个解析器,它基本上可以执行赋值、函数声明、函数调用和打印语句。问题是,在我给出输入后,我得到的输出是语法错误。所以我认为我的语法会导致这种情况,但我不确定。这是我的文件:

扫描仪.flx:

%option noyywrap
%option yylineno

%{

#include "parser.tab.h"

%}

IDENT [a-zA-Z_][a-zA-Z0-9_]*
INT -?[0-9]+
STRING "[\S\s]*?"
UNFSTRING "[\S\s]*?[^"]$

%%
"int" return tINT;
"string" return tSTRING;
"return" return tRETURN;
"print" return tPRINT;
"(" return tLPAR;
")" return tRPAR;
"," return tCOMMA;
"%" return tMOD;
"=" return tASSIGNM;
"-" return tMINUS;
"+" return tPLUS;
"/" return tDIV;
"*" return tSTAR;
";" return tSEMI;
"{" return tLBRAC;
"}" return tRBRAC;
{IDENT} return tIDENT;
{INT} return tINTVAL;
{STRING} return tSTRINGVAL;
{UNFSTRING} return tUNFSTRING;
[ \t\n]+
. { /* pass any other character to the parser */
  return yytext[0];
}
%%

解析器.y:

%{
#include <stdio.h>

void yyerror (const char *s)
{
    printf ("%s\n", s);
}
%}

%token tINT tSTRING tRETURN tPRINT tLPAR tRPAR tCOMMA tMOD tASSIGNM tMINUS tPLUS tDIV tSTAR tSEMI tLBRAC tRBRAC tIDENT tINTVAL tSTRINGVAL tUNFSTRING

%left '='
%left '+' '-'
%left '*' '/'
%left '(' ')'


%%

CVD19       :              stmtlst
;

stmtlst     :              stmtlst stmt
            |              stmt
            ;

stmt        :              funcDecl
            |              varDecl
            |              assgnmt
            |              callfunc
            |              printstmt
            ;

funcDecl    :              type tIDENT '(' ')' '{' funcbody return '}'              {  printf("FUNCTION ");  }
            |              type tIDENT '(' funcparams ')' '{' funcbody return '}'   {  printf("FUNCTION W/PARAMS ");  }
            ;

funcbody    :              varDecl
            |              assgnmt
            |              callfunc
            |              printstmt
            ;

return      :              tRETURN expr ';'
            ;

funcparams  :              funcparams ',' type tIDENT
            |              type tIDENT
            ;

varDecl     :              type vars '=' expr ';'
            ;

type        :              tINT              {  printf("INT TYPE ");  }
            |              tSTRING           {  printf("STRING TYPE ");  }
            ;

assgnmt     :              tIDENT '=' expr ';'           {  printf("ASSIGNMENT");  }
            ;

callfunc    :              tIDENT '(' ')' ';'            {  printf("FUNCTION CALL");  }
            |              tIDENT '(' vars ')' ';'       {  printf("FUNCTION W/PARAMs CALL");  }
            ;

printstmt   :              tPRINT '(' expr ')' ';'          {  printf("PRINTSTMT 1");  }
            |              tPRINT '(' callfunc ')' ';'      {  printf("PRINTSTMT 2");  }
            ;


vars        :              vars ',' tIDENT
            |              tIDENT            {  printf("IDENT ");  }
            ;

expr        :              value
            |              expr '+' expr     {    $$  =  $1  +  $3;  }
            |              expr '-' expr     {    $$  =  $1  -  $3;  }
            |              expr '*' expr     {    $$  =  $1  *  $3;  }
            |              expr '/' expr     {    $$  =  $1  /  $3;  }
            ;         

value       :              tINTVAL                                {  printf("INTVAL ");  }
            |              tSTRINGVAL                             {  printf("STRINGVAL ");  }
            |              tUNFSTRING                             {  printf("UNFSTRING ");  }
            /*|              tIDENT    MIGHT BE PROBLEMATIC     { $$ = $1; }*/
            ;

%%

int main ()
{
   if (yyparse()) {
   // parse error
       printf("ERROR\n");
       return 1;
   }
   else {
   // successful parsing
      printf("OK\n");
      return 0;
   }
}

当我尝试在 MacOS 终端中运行我的文件时,我照常使用这些命令:

flex scanner.flx

- 没问题 -

bison -d parser.y

- 没问题 -

gcc -o program lex.yy.c parser.tab.c -ll

- 警告 -

parser.tab.c:1330:16: warning: implicit declaration of function 'yylex' is invalid in C99
      [-Wimplicit-function-declaration]
      yychar = YYLEX;
               ^
parser.tab.c:686:16: note: expanded from macro 'YYLEX'
# define YYLEX yylex ()
               ^
1 warning generated.

这是 parser.tab.c 中的第 1330 行附近:

/* First try to decide what to do without reference to look-ahead token.  */
  yyn = yypact[yystate];
  if (yyn == YYPACT_NINF)
    goto yydefault;

  /* Not known => get a look-ahead token if don't already have one.  */

  /* YYCHAR is either YYEMPTY or YYEOF or a valid look-ahead symbol.  */
  if (yychar == YYEMPTY)
    {
      YYDPRINTF ((stderr, "Reading a token: "));
      yychar = YYLEX;  /* THIS IS LINE 1330 <=============================================
    }

  if (yychar <= YYEOF)
    {
      yychar = yytoken = YYEOF;
      YYDPRINTF ((stderr, "Now at end of input.\n"));
    }
  else
    {
      yytoken = YYTRANSLATE (yychar);
      YY_SYMBOL_PRINT ("Next token is", yytoken, &yylval, &yylloc);
    }

这是我的输入:

输入1:

int num = 123;

输出1:

INT TYPE IDENT syntax error
ERROR

输入2:

print("str");

输出2:

syntax error
ERROR

输入3:

int func(int i) {
 i = 5; 
 return i;
}

输出3:

INT TYPE IDENT syntax error
ERROR
4

1 回答 1

3

您的基本问题是您在语法中使用字符文字(这很好),但没有在词法分析器中返回它们(这不好)。

代替

"(" return tLPAR;
")" return tRPAR;
// etc.

只需让这些字符落入您的后备规则:

.  { return yytext[0]; }

然后您还可以摆脱%token这些单字符标记的定义,因为您使用的是单字符文字。

不幸的是,你不能用更长的令牌做到这一点。因此,您的关键字标记必须保持原样。

此外,您对字符串的规则是完全错误的。请阅读(f)lex 正则表达式的文档,而不是依赖其他一些正则表达式语法。Flex 无法识别\S\s转义。它没有实现非贪婪重复(*?)。它确实"用作一种特殊的语法(意思是带引号的文字字符串)——事实上,您已经在其他规则中使用过它,所以您不应该期望"成为您STRING格式中的常规字符。并且$不能在宏中使用(事实上,在这个扫描仪定义中没有充分的理由使用宏;我总是建议避免使用它们,除非有充分的理由。)

一种可能的字符串操作是:

["]([^"]|\\.|\\\n)*["]   { return tSTRINGVAL; }

我强烈建议您阅读野牛手册中关于调试语法printf的章节,特别是关于如何启用解析器跟踪的部分,这比在解析器操作中插入调用更准确和信息丰富。(事实上​​,这会向您展示您的问题。)


您的问题与编译器产生的警告无关,但您应该修复它。发生这种情况是因为您尚未yylex在野牛序言中声明。把它放在你的定义之前yyerror

int yylex(void);

以便编译器知道原型yylex是什么。(您必须声明它,因为野牛不会为您这样做。)

于 2020-04-23T21:38:27.760 回答