1

我有以下语法,我想解析输入以获取相关的 AST。使用 ANTLR for Java 一切都很容易。从 ANTLR4 开始,在语法文件中,您不必指定选项 `output=AST; 获取 AST 信息。

你好.g

grammar  Hello; //  Define  a  grammar  called  Hello
stat    :   expr NEWLINE       
    |   ID '=' expr NEWLINE 
    |   NEWLINE   
        | expr
    ;

expr:   atom (op atom)* ;

op  : '+'|'-' ;

atom    :   INT |   ID;

ID  :   [a-zA-Z]+ ;

INT :  [0-9]+ ;

NEWLINE :   '\r' ? '\n' ;

WS  :   [ \t\r\n]+ -> skip ;

测试.java

import  org.antlr.v4.runtime.*;
import  org.antlr.v4.runtime.tree.*;
import java.io.*;
import lib.HelloLexer;
import lib.HelloParser;
public class Test {
    public  static  void  main(String[]  args)  throws  Exception  {
        ANTLRInputStream  input  =  new  ANTLRInputStream("5 + 3");
        //  create  a  lexer  that  feeds  off  of  input  CharStream
        HelloLexer  lexer  =  new  HelloLexer(input);
        //  create  a  buffer  of  tokens  pulled  from  the  lexer
        CommonTokenStream  tokens  =  new  CommonTokenStream(lexer);
        //  create  a  parser  that  feeds  off  the  tokens  buffer
        HelloParser  parser  =  new  HelloParser(tokens);
        ParseTree  tree  =  parser.expr();  //  begin  parsing  at  init  rule
        //System.out(tree.toStringTree(parser));  //  print  LISP-style  tree
        System.out.println(tree.toStringTree(parser));
    }   
}

输出将是:

(expr (atom 5) (op +) (atom 3))

但是您能告诉我如何通过 Python 实现获得相同的结果吗?目前,我正在使用 ANTLR 3.1.3 Runtime for Python。以下代码仅返回“(+ 5 3)”

测试.py

import sys
import antlr3
import antlr3.tree
from antlr3.tree import Tree
from HelloLexer import *
from HelloParser import *

char_stream = antlr3.ANTLRStringStream('5 + 3')
lexer = ExprLexer(char_stream)
tokens = antlr3.CommonTokenStream(lexer)
parser = ExprParser(tokens)
r = parser.stat()

print r.tree.toStringTree()
4

2 回答 2

1

目前没有针对 ANTLR 4 的 Python 目标,并且 ANTLR 3 不支持自动生成解析树来生成您正在查看的输出。

您也许可以使用 ANTLR 3 中的 AST 创建功能来生成树,但它不会具有与 ANTLR 4 相同的形式(当然也不是简单性)。

于 2014-02-21T03:40:45.800 回答
1

Python 现在有一个 antlr4 运行时(https://theantlrguy.atlassian.net/wiki/display/ANTLR4/Python+Target),但 toStringTree 是 Python 运行时中的一个类方法。您可以这样调用它来获取包含字符串化标记的 lisp 样式解析树:

from antlr4 import *
from antlr4.tree.Trees import Trees
# import your parser & lexer here

# setup your lexer, stream, parser and tree like normal

print(Trees.toStringTree(tree, None, parser))

# the None is an optional rule names list
于 2015-08-03T11:50:32.753 回答