parsing - Jison：区分数字和数字

Question

我有以下我想与 Jison 一起使用的最小语法示例。

/* lexical grammar */
%lex
%%

\s+                   /* skip whitespace */
[0-9]+("."[0-9]+)?\b  return 'NUMBER'
[0-9]                 return 'DIGIT'
[,-]                  return 'SEPARATOR'

// EOF means "end of file"
<<EOF>>               return 'EOF'
.                     return 'INVALID'

/lex

%start expressions

%% /* language grammar */

expressions
    : e SEPARATOR d EOF
        {return $1;}
    ;

d
    : DIGIT
        {$$ = Number(yytext);}
    ;

e
    : NUMBER
        {$$ = Number(yytext);}
    ;

在这里，我已经定义了NUMBER和DIGIT，以便根据上下文同时允许数字和数字。我不知道的是我如何定义上下文。上面的例子总是返回

Expecting 'DIGIT', got 'NUMBER'

当我尝试在Jison 调试器中运行它时。如何定义语法以始终期望分隔符后有一个数字？我尝试了以下也不起作用

/* lexical grammar */
%lex
%%

\s+                   /* skip whitespace */
[,-]                  return 'SEPARATOR'

// EOF means "end of file"
<<EOF>>               return 'EOF'
.                     return 'INVALID'

/lex

%start expressions

%% /* language grammar */

expressions
    : e SEPARATOR d EOF
        {return $1;}
    ;

d
    : [0-9]
        {$$ = Number(yytext);}
    ;

e
    : [0-9]+("."[0-9]+)?\b
        {$$ = Number(yytext);}
    ;

score 4 · Accepted Answer

经典的扫描器/解析器模型（最初来自 lex/yacc，也由 jison 实现）将扫描器放在解析器之前。换句话说，扫描器应该在不考虑解析上下文的情况下对输入流进行标记。

大多数词法扫描器生成器，包括 jison，都为扫描器提供了一种适应上下文的机制（参见“启动条件”），但是扫描器自己负责跟踪上下文，这变得非常丑陋。

在这种情况下，最简单的解决方案是仅定义一个NUMBER标记，并让解析器检查实际需要DIGIT. DIGIT这将起作用，因为和之间的差异NUMBER不会影响解析，只会使某些解析非法。如果两者之间的差异决定了使用哪个产品，那将是不同的NUMBER，DIGIT但这可能是模棱两可的，因为所有数字实际上也是数字。

另一种解决方案是允许一个数字NUMBER或DIGIT其中一个数字是允许的。这将需要更改e以使其接受NUMBERor DIGIT，并确保在两者和都可能DIGIT的情况下胜出。这需要将其规则放在语法文件的前面，并在末尾添加：NUMBERDIGIT\b

[0-9]\b               return 'DIGIT'
[0-9]+("."[0-9]+)?\b  return 'NUMBER'

parsing - Jison：区分数字和数字

1 回答 1

Related

Reference