最直接的方法是使每个规则(或“生产”)成为一个函数。这称为“递归下降”解析器。
编写两个例程来查看并获取下一个字符。
这将为您提供一些看起来像这样的代码(在伪代码中):
// <sequent> ::= <lhs> # <rhs>
sequent()
lhs()
if peekchar() != '#' then error
else poundsign = nextchar()
rhs()
// <lhs> ::= <formulalist>| ε
lhs()
if peekchar() == EOF
return
else
formula()
// <rhs> ::= <formulalist>| ε
rhs()
if peekchar() == EOF
return
else
formulalist()
// <formulalist> ::= <formula>|<formula> , <formulalist>
formulalist()
formula()
if peekchar() is ','
comma = nextchar()
return formulalist()
// <formula> ::= <letter>| - <formula>| (<formula><infixop><formula>)
formula()
next = peekchar()
if next in A..Z
letter
else if next is -
minus_sign = nextchar()
return formula()
else
formula()
infixop()
formula()
// <infixop> ::= & | | | >
infixop()
c = nextchar()
if c not in &,|,> then error
// <letter> ::= A | B | ... | Z
letter()
c = nextchar()
if c not A..Z then error
等等,对于每个规则。
总体思路:
- 每个规则都是一个函数
- 在某些时候,该功能会向前看,看看要做什么。例如,formula() 检查第一个字符是否为减号。