1

假设我有一个简单的 JavaCC 语法来解析加法和减法:


....
void CompilationUnit() :
{}
{
  (Expression())+
  EOF
}
void Expression() :
{}
{
  Number()
  (
    Addition()
  | Subtraction()
  )*
}
void Number() :
{}
{
  
}
void Addition() :
{}
{
   Number()
}
void Subtraction() :
{}
{
   Number()
}

我有使用此语法生成的 AST 来计算结果的类:


public class Calculator extends DepthFirstVisitor {
  int result = -1;
  public void visit(Expression n) {
    if (result >= 0) System.out.println(toText(n) + " = " + result);
    result = 0;
    super.visit(n);
  }
  public void visit(Number n) {
    ...
  }
  public void visit(Addition n) {
    ...
  }
  ....
}

我能够计算表达式的值,但我也需要原始表达式(就像它出现的那样)。所以对于以下输入:

  5 + 2 - 1
  2 + 1

我想要以下输出:

5 + 2 - 1 = 6
2 + 1 = 3

不幸的是,因为我跳过了空格或换行符之类的字符,所以我得到的是:

5+2-1 = 6
2+1 = 3

有什么办法可以输出原始文本(包括跳过的字符)?

请注意,实际问题要大得多,语法要复杂得多。所以我并不是真的在寻找针对上述问题的解决方案(例如预处理行并将它们拆分为换行符或修改方法以“手动”在每个标记后添加空格),但更像是使用一些 JavaCC 功能的解决方案.

4

2 回答 2

2

ANTLr 和 Xtext 都支持空白和注释的“隐藏标记”。请参阅此处以获取一些提示或将 Google 与该术语一起使用。也许JavaCC 有一些类似的概念。

编辑:JavaCC 似乎使用术语“特殊令牌”。请参阅此处了解一些详细信息

于 2013-05-01T11:20:13.403 回答
0

基本上你不能在编译器中做到这一点。您必须在语法中捕获空格作为标记,并在任何允许的地方允许它,无处不在,并且由此产生的语法将非常复杂,以至于无法实现甚至生成。您将不得不捕获对实体来自的源代码(行和列)中坐标的引用:例如,可能是当前行号和列号的文本。

编译器的行为方式是有原因的。

于 2013-05-01T10:27:34.930 回答