12

我有一些使用 ANTLR 编写解析器的经验,我正在尝试(用于自学:))将其中一个移植到 PEG(解析表达式语法)。

当我试图了解这个想法时,有一件事让我觉得很麻烦,以至于我觉得我错过了一些东西:如何处理空白。

在 ANTLR 中,处理空格和注释的正常方法是将标记放在隐藏通道中,但是使用 PEG 语法没有标记化步骤。考虑到 C 或 Java 等语言几乎在任何地方都允许使用注释,因此人们想立即“隐藏”注释,但由于注释可能具有语义含义(例如在生成代码文档、类图等时),因此不只是想丢弃它们。

那么,有没有办法解决这个问题?

4

2 回答 2

10

因为没有单独的标记化阶段,所以没有“时间”来丢弃某些字符(或标记)。

由于您熟悉 ANTLR,因此可以这样想:假设 ANTLR 只处理 PEG。所以你只有解析器规则,没有词法分析器规则。现在你将如何丢弃空格?(你不能)。

所以,你的问题的答案是:你不能,你必须在 PEG 中用空格规则乱扔你的语法:

ANTLR

add_expr
 : Num Add Num
 ;

Add   : '+';
Num   : '0'..'9'+;
Space : ' '+ {skip();};

聚乙二醇

add_expr
 : num _ '+' _ num
 ;

num : '0'..'9'+;
_   : ' '*;
于 2012-04-13T11:13:34.543 回答
2

可以嵌套 PEG 解析器。这个想法是第一个解析器使用字符并将标记提供给第二个解析器。第二个 PEG 解析器使用令牌并完成实际工作。

当然,这意味着您放弃了 Parsing Expression Grammar 与其他解析方案相比的一个优势:PEG 的简单性。

于 2012-05-05T17:08:30.553 回答