1

我有一个文件,我想忽略其中的一部分。在 Lexer 中,我使用门控语义谓词来避免为文件中不感兴趣的部分创建标记。我的规则类似于以下内容。

A 
: {!ignore}?=> 'A' 
;
START_IGNORE
: 'foo' {ignore = true; skip();}
;
END_IGNORE
: 'oof' {ignore = false; skip();}
;
IGNORE
: {ignore}?=> . {skip();}
;    

但是,除非我将 START 和 END 更改为也使用语义谓词(如下所示),否则它不起作用..

A 
: {!ignore}?=> 'A' 
;
START_IGNORE
: {true}?=> 'foo' {ignore = true; skip();}
;
END_IGNORE
: {true}?=> 'oof' {ignore = false; skip();}
;    
IGNORE
: {ignore}?=> . {skip();}
;  

为什么我必须添加谓词?

编辑:我正在使用 antlr-3.4

4

1 回答 1

1

为什么我必须添加谓词?

你没有。至少,不使用 ANTLR v3.3。我不知道测试的准确程度,但不要使用 ANTLRWorks 的解释器或 Eclipse ANTLR IDE 插件。总是从命令行做一些小测试。

grammar T;

@parser::members {
  public static void main(String[] args) throws Exception {
    TLexer lexer = new TLexer(new ANTLRStringStream("A foo A B C oof A"));
    TParser parser = new TParser(new CommonTokenStream(lexer));
    parser.parse();
  }
}

@lexer::members {
  private boolean ignore = false;
}

parse
 : (t=. 
     {System.out.printf("[\%02d] type=\%s text='\%s'\n", $t.getCharPositionInLine(), tokenNames[$t.type], $t.text);}
   )* EOF
 ;

A 
 : {!ignore}?=> 'A' 
 ;

START_IGNORE
 : 'foo' {ignore = true; skip();}
 ;

END_IGNORE
 : 'oof' {ignore = false; skip();}
 ;

IGNORE
 : {ignore}?=> . {skip();}
 ;    

SPACE
 : ' ' {skip();}
 ;

像这样运行它:

java -cp antlr-3.3.jar org.antlr.Tool Tg
javac -cp antlr-3.3.jar *.java
java -cp .:antlr-3.3.jar TParser

这将打印以下内容:

[00] 类型=A 文本='A'
[16] 类型=A 文本='A'

即:从输入"A foo A B C oof A"以下:"foo A B C oof"skipped。

于 2012-07-09T18:54:38.920 回答