0

我正在尝试为答案集编程(ASP)的方言编写解析器,就语法而言,它看起来像带有一些扩展的Prolog 。例如,一种扩展是扩展,这意味着fact(1..3).例如在 中扩展fact(1). fact(2). fact(3).。请注意,该语言可以理解数字并INT用作终止符。FLOAT.

在某些情况下,解析器无法区分整数、浮点数、扩展名和分隔符,因为我认为该语言显然是模棱两可的。在这种情况下,我必须用空格明确分隔标记。但是,任何PrologASP解析器都可以正确处理此类产生式。我读到ANTLR4可以自动消除有问题的产品的歧义,但可能需要一些帮助,但我不知道该怎么做!;-) 我在这里这里读过类似的东西,但显然他们没有帮助我。

有人可以告诉我该怎么做才能克服这种歧义吗?请注意,我无法更改语言,因为它非常标准。为了简化专家的工作,我创建了一个最小的工作示例,如下所示。

grammar Test;

program: 
  statement* ;

statement: // DOT is the statement terminator
  range DOT |
  intNum DOT |
  floatNum DOT ;

intNum: // not needed, but helps in TestRig
  INT;

floatNum: // not needed, but helps in TestRig
  FLOAT;

range: // defines an expansion
  INT DOTS INT ;

DOTS: '..';
DOT: '.';

FLOAT: DIGIT+ '.' DIGIT* | '.' DIGIT+ ;
INT: DIGIT+ ;

WS: [ \t\r\n]+ -> skip ;

fragment NONZERO     : [1-9] ;
fragment DIGIT       : [0] | NONZERO ;

我使用以下输入:

1 .
1. .
1.5 .
.5 .
1 .. 5 .

1.
1..
1.5.
.5.
1..5.

我得到以下错误,这些错误被其他工具解析纠正:

line 8:0 extraneous input '1.' expecting '.'
line 11:2 extraneous input '.5' expecting '.'

提前谢谢了!

4

3 回答 3

1

在您的 DOTS 规则之前,为语句终端点添加一个唯一规则并消除 DOTS 规则的歧义(并更改您的其他规则以使用 TERMINAL):

TERMINAL: DOT { isTerminal(1) }? ;
DOTS: DOT DOT { !isTerminal(2) }? ;
DOT: '.';

其中谓词方法只是在 _input 字符流上向前看,以查看在当前标记索引处下一个字符是否为空格。将这样的内容放在语法中的 @member 块中:

public boolean isTerminal(int la) {
    int offset = _tokenStartCharIndex + 1 + la;
    String s = _input.getText(Interval.of(offset, offset));
    if (Character.isWhitespace(s.charAt(0))) {
        return true;
    }
    return false;
}

如果空格在 DOTS 和尾随 INT 之间有效,则可能需要做更多的工作。

于 2014-04-14T22:29:12.123 回答
1

我建议将工作转移到解析器。

如果词法分析器无法决定是否1..21. .21 .. 2离开是否由解析器决定。

也许有一个上下文可以将其解释为第一个选项,而另一个上下文可以将其解释为第二个选项。

顺便说一句:1..2.可以解释为1 .. 2 .( range) 或1. . 2 .( floatNum, intNum)。你想如何处理这个问题?

以下语法应该解析所有内容。但请注意,. .它的处理方式dots与! 您可以在解析时或解析后检查这些难点(取决于它是否会影响解析)。1 . 23floatNum

grammar Test;

program: 
  statement* ;

statement: // DOT is the statement terminator
  range DOT |
  intNum DOT |
  floatNum DOT ;

intNum: // not needed, but helps in TestRig
  INT;

floatNum: 
    INT DOT INT? | DOT INT ;

range: // defines an expansion
  INT dots INT ;

dots : DOT DOT;  

DOT: '.';

INT: DIGIT+ ;

WS: [ \t\r\n]+ -> skip ;

fragment NONZERO     : [1-9] ;
fragment DIGIT       : [0] | NONZERO ;
于 2014-04-15T12:21:28.023 回答
0

Prolog 不接受1.作为浮点数。此功能使您的语法更加模棱两可,因此可以尝试删除该功能。

于 2014-05-01T16:48:03.550 回答