algorithm - 有没有一种通用的方法可以将明确的上下文无关语法转换为 LALR(1) 语法？

Question

我正在尝试为以下语法创建一个 LALR(1) 解析器并找到一些移位/减少冲突。

S := expr
expr := lval | ID '[' expr ']' OF expr
lval := ID | lval '[' expr ']'

所以解析器无法正确解析字符串“ID[ID]”。我的问题是，

是否有任何通用方法可以将此类非 LALR(1) 语法转换为 LALR(1) 语法？
如果两个文法生成完全相同的语言，并且我们知道其中一个不是 LALR(1)，我们能否知道另一个是否是 LALR(1)？

上面提到的语法只是一个例子，我真正想知道的是解决这些语法问题的一般方法。欢迎任何建议或阅读建议。

提前致谢。

score 3 · Accepted Answer

1. 是否有任何通用方法可以将此类非 LALR(1) 语法转换为 LALR(1) 语法？

不可以。将任意上下文无关文法 (CFG) 转换为 LALR(1) 文法可能也可能不可行。此外，如果您有 CFG 和 LALR(1) 语法，您无法判断它们是否识别相同的语言。（更糟糕的是，没有算法甚至可以告诉您任意 CFG 是否能够识别其字母表中所有可能的字符串。）

2. 如果两个文法生成完全相同的语言，并且我们知道其中一个不是 LALR(1)，我们能否知道另一个是否是 LALR(1)？

再次，不。如上所述，没有算法可以验证两种语法是否生成相同的语言，但即使假设您知道两种语法生成相同的语言，其中一个不是 LALR(1) 的事实并不能告诉您另一个一。

然而，有一个有用的结果。如果你有一个有限 k > 1 的 LALR(k) 文法，那么你可以生成一个 LALR(1) 文法。换句话说，对于 k > 1，没有 LALR(k)语言这样的东西；如果一种语言有一个 LALR(k) 文法，那么对于任何 k' 满足 1 ≤ k' < k，它都有一个 LALR(k') 文法。

但是，这对您的语法没有帮助，因为无法通过增加对任何有限值的前瞻来消除冲突。

不过，有一种简单的方法可以消除特定的班次减少冲突，而且这种技术通常很有效。考虑两个相互冲突的规则：

lval := lval '[' expr ']'
expr := ID   '[' expr ']' OF expr

问题是，在第一种情况下，ID必须立即减少到lval（或至少在以下expr减少之前），但在第二种情况下，它可能不会减少到lval. expr但是在我们减少和遇到OF（或不是）之前，我们无法判断我们处于哪种情况。

如果我们可以在lval不进行内部lval归约的情况下完成生产，那么我们就不会有问题，因为实际的归约会在紧随其后的标记]可见时发生。

这可能有一个技术术语，但我不知道。我一直将其描述为“减少延迟”，并且在许多情况下并不是很困难：

lval' := ID `[` expr `]`
      |  lval' `[` expr `]`
lval  := ID
      |  lval'
expr  := lval
      |  ID '[' expr ']' OF expr

algorithm - 有没有一种通用的方法可以将明确的上下文无关语法转换为 LALR(1) 语法？

1 回答 1

Related

Reference