parsing - 分号作为由 flex/bison 解析的自定义语法中的分隔符

Question

我正在尝试为元编程语言编写一个简单的解析器。一切正常，但我想使用';' 作为语句分隔符，而不是换行符或完全省略分号。

所以这是预期的行为：

// good code
v1 = v2;
v3 = 23;

应该解析没有错误

但：

// bad code
v1 = v2
v3 = 23;

应该失败

但是，如果我从分隔符中删除“空”规则，则两个代码都会失败，如下所示：

ID to ID
Error detected in parsing: syntax error, unexpected ID, expecting SEMICOLON
;

如果我让“空”规则处于活动状态，那么两个代码都被接受，这是不希望的。

ID to ID   // should raise error
ID to NUM;

这里欢迎任何帮助，因为大多数教程根本不涉及分隔符。

这是我的解析器/lexxer 的简化版本：

解析器.l：

%{
#include "parser.tab.h"
#include<stdio.h>
%}

num      [0-9]
alpha    [a-zA-Z_]
alphanum [a-zA-Z_0-9]
comment "//"[^\n]*"\n"
string  \"[^\"]*\"
whitespace [ \t\n]

%x ML_COMMENT


%%
<INITIAL>"/*"               {BEGIN(ML_COMMENT); printf("/*");}
<ML_COMMENT>"*/"            {BEGIN(INITIAL); printf("*/");}  
<ML_COMMENT>[.]+            { }
<ML_COMMENT>[\n]+           { printf("\n"); }
{comment}+                  {printf("%s",yytext);}

{alpha}{alphanum}+          { yylval.str= strdup(yytext); return ID;}
{num}+                      { yylval.str= strdup(yytext); return NUM;}
{string}                    { yylval.str= strdup(yytext); return STRING;}

';'                         {return SEMICOLON;}
"="                         {return ASSIGNMENT;}
" "+                        { }
<<EOF>>                     {exit(0); /* this is suboptimal */}
%%

解析器.y：

%{
#include<stdio.h>
#include<string.h>
%}

%error-verbose

%union{
        char *str;
}

%token  <str> ID
%token  <str> NUM
%token  <str> STRING
%left SEMICOLON
%left ASSIGNMENT

%start input

%%
input:  /* empty */
        | expression separator input
;

expression: assign 
            | error {}
;

separator:  SEMICOLON
            | empty
;

empty:      
;

assign:   ID ASSIGNMENT ID      { printf("ID to ID"); }
        | ID ASSIGNMENT STRING  { printf("ID to STRING"); }
        | ID ASSIGNMENT NUM     { printf("ID to NUM"); }
;

%%

yyerror(char* str)
{
        printf("Error detected in parsing: %s\n", str);
}

main()
{
        yyparse();
}

编译如下：

$>flex -t parser.l > parser.lex.yy.c
$>bison -v -d parser.y
$>cc parser.tab.c parser.lex.yy.c -lfl -o parser

score 3 · Accepted Answer

没关系......有问题的线路是这一行：

';'                         {return SEMICOLON;}

需要更改为

";"                         {return SEMICOLON;}

现在行为是正确的。:-)

parsing - 分号作为由 flex/bison 解析的自定义语法中的分隔符

1 回答 1

Related

Reference