parsing - 递归下降解析 - 从 LL(1) 向上

Question

以下简单的“计算器表达式”文法（BNF）可以很容易地用一个简单的递归下降解析器来解析，它是预测性的 LL(1)：

<expr>      :=  <term> + <term>
            |   <term> - <term>
            |   <term>
<term>      :=  <factor> * <factor>
                <factor> / <factor>
                <factor>
<factor>    :=  <number>
            |   <id>
            |   ( <expr> )
<number>    :=  \d+
<id>        :=  [a-zA-Z_]\w+

因为看到下一个标记总是足以知道要选择的规则。但是，假设我添加了以下规则：

<command>   :=  <expr>
            |   <id> = <expr>

为了在命令行上与计算器进行交互，使用变量，如下所示：

calc> 5+5
=> 10
calc> x = 8
calc> 6 * x + 1
=> 49

我不能使用简单的 LL(1) 预测解析器来解析<command>规则，这是真的吗？我试图为它编写解析器，但似乎我需要知道更多的令牌。是使用回溯的解决方案，还是我可以只实现 LL(2) 并始终向前看两个令牌？

RD 解析器生成器如何处理这个问题（例如，ANTLR）？

score 7 · Accepted Answer

问题

<command>   :=  <expr>
            |   <id> = <expr>

是当您“看到”时，<id>您无法判断它是分配的开始（第二条规则）还是“ <factor>”。您只会知道何时阅读下一个令牌。

AFAIK ANTLR 是 LL(*) （如果我没记错的话，它也能够生成老鼠包解析器）所以它可能会同时考虑两个标记来处理这个语法。

如果您可以使用语法，我建议您为作业添加一个关键字（例如let x = 8）：

<command>   :=  <expr>
            |   "let" <id> "=" <expr>

或使用=表示评估：

<command>   :=  "=" <expr>
            |   <id> "=" <expr>

score 5 · Accepted Answer

我认为使用递归下降解析器有两种方法可以解决这个问题：使用（更多）前瞻或回溯。

展望

command() {
    if (currentToken() == id && lookaheadToken() == '=') {
        return assignment();
    } else {
        return expr();
    }
}

回溯

command() {
    savedLocation = scanLocation();
    if (accept( id )) {
         identifier = acceptedTokenValue();
         if (!accept( '=' )) {
             setScanLocation( savedLocation );
             return expr();
         }
         return new assignment( identifier, expr() );
    } else {
         return expr();
    }
}

score 2 · Accepted Answer

问题是语法：


<command>   :=  <expr>
            |   <id> = <expr>

不是一个相互递归的过程。对于递归体面的解析器，您将需要确定非递归等价物。

rdentato post's 展示了如何解决这个问题，假设你可以使用语法。这个 powerpoint 更详细地说明了这个问题并展示了如何纠正它： http://www.google.com/url?sa=t&source=web&ct=res&cd=7&url=http%3A%2F%2Fxml.cs。 nccu.edu.tw%2Fcourses%2Fcompiler%2Fcp2006%2Fslides%2Flec3-Parsing%26TopDownParsing.ppt&ei=-YLaSPrWGaPwhAK5ydCqBQ&usg=AFQjCNGAFrODJxoxkgJEwDMQ8A8594vn0Q&sig2=nlYKQVfakmqy_57137x

score 1 · Accepted Answer

ANTLR 3使用“LL(*)”解析器而不是 LL(k) 解析器，因此如果必须使用特别优化的确定性有限自动机（ DFA)。

parsing - 递归下降解析 - 从 LL(1) 向上

4 回答 4

展望

回溯

Related

Reference