6

在普通的 PEG(解析表达式语法)中,这是一个有效的语法:

values <- number (comma values)*
number <- [0-9]+
comma  <- ','

但是,如果我尝试使用 LPeg 编写此规则,则该规则的递归性质将失败:

local lpeg   = require'lpeg'

local comma  = lpeg.P(',')
local number = lpeg.R('09')^1
local values = number * (comma * values)^-1
--> bad argument #2 to '?' (lpeg-pattern expected, got nil)

尽管在这个简单的示例中我可以重写规则以不使用递归,但我有一些现有的语法我不想重写。

如何在 LPeg 中编写自引用规则?

4

2 回答 2

5

使用语法

通过使用 Lua 变量,可以逐步定义模式,每个新模式都使用之前定义的模式。然而,这种技术不允许定义递归模式。对于递归模式,我们需要真正的语法。

LPeg 用表格表示语法,其中每个条目都是一个规则。

调用 lpeg.V(v) 创建了一个模式,该模式表示语法中索引为 v 的非终结符(或变量)。因为在评估此函数时语法仍然不存在,所以结果是对相应规则的开放引用。

表格在转换为模式时是固定的(通过调用 lpeg.P 或在预期模式中使用它)。然后由 lpeg.V(v) 创建的每个开放引用被更正以引用表中由 v 索引的规则。

当一个表被固定时,结果是一个匹配其初始规则的模式。表中索引为 1 的条目定义了它的初始规则。如果该条目是字符串,则假定它是初始规则的名称。否则,LPeg 假定条目 1 本身是初始规则。

例如,以下语法匹配具有相同数量的 a 和 b 的 a 和 b 的字符串:

equalcount = lpeg.P{
  "S";   -- initial rule name
  S = "a" * lpeg.V"B" + "b" * lpeg.V"A" + "",
  A = "a" * lpeg.V"S" + "b" * lpeg.V"A" * lpeg.V"A",
  B = "b" * lpeg.V"S" + "a" * lpeg.V"B" * lpeg.V"B",
} * -1

它等价于标准 PEG 表示法中的以下文法:

  S <- 'a' B / 'b' A / ''
  A <- 'a' S / 'b' A A
  B <- 'b' S / 'a' B B
于 2014-10-01T20:24:17.100 回答
0

我知道这是一个迟到的答案,但这是一个如何反向引用规则的想法

local comma  = lpeg.P(',')
local number = lpeg.R('09')^1
local values = lpeg.P{ lpeg.C(number) * (comma * lpeg.V(1))^-1 }

local t = { values:match('1,10,20,301') }

基本上,原始语法被传递给lpeg.P(语法只是一个美化的表),它通过数字而不是名称来引用第一条规则 ie lpeg.V(1)

该示例只是在终端上添加了一个简单的lpeg.C捕获number并将所有这些结果收集到本地表中t以供进一步使用。(请注意,没有lpeg.Ct使用这没什么大不了的,但仍然......我猜是样本的一部分。)

于 2016-01-03T20:03:27.120 回答