我已经用 Alex 编写了一个词法分析器,并且正在尝试将它连接到一个用 Happy 编写的解析器。我会尽力总结我的问题而不粘贴大量代码。
我从我的词法分析器的单元测试中知道该字符串"\x7"
被用于:
[TokenNonPrint '\x7', TokenEOF]
我的令牌类型(由词法分析器吐出)是Token
. 我已经定义lexWrap
并如此处alexEOF
所述,它为我提供了以下标头和令牌声明:
%name parseTokens
%tokentype { Token }
%lexer { lexWrap } { alexEOF }
%monad { Alex }
%error { parseError }
%token
NONPRINT {TokenNonPrint $$}
PLAIN { TokenPlain $$ }
我使用以下命令调用 parser+lexer 组合:
parseExpr :: String -> Either String [Expr]
parseExpr s = runAlex s parseTokens
这是我的前几部作品:
exprs :: { [Expr] }
exprs
: {- empty -} { trace "exprs 30" [] }
| exprs expr { trace "exprs 31" $ $2 : $1 }
nonprint :: { Cmd }
: NONPRINT { NonPrint $ parseNonPrint $1}
expr :: { Expr }
expr
: nonprint {trace "expr 44" $ Cmd $ $1}
| PLAIN { trace "expr 37" $ Plain $1 }
我将省略 和 的数据类型声明,Expr
因为NonPrint
它们很长,而且这里只有构造函数Cmd
和NonPrint
问题。该函数parseNonPrint
在 Parse.y 的底部定义为:
parseNonPrint :: Char -> NonPrint
parseNonPrint '\x7' = Bell
此外,我的错误处理函数如下所示:
parseError :: Token -> Alex a
parseError tokens = error ("Error processing token: " ++ show tokens)
像这样写,我希望通过以下 hspec 测试:
parseExpr "\x7" `shouldBe` Right [Cmd (NonPrint Bell)]
但相反,我看到"exprs 30"
print一次(即使我正在运行 5 个不同的单元测试)和我所有的parseExpr
return测试Right []
。我不明白为什么会这样,但我改变了exprs
生产以防止它:
exprs :: { [Expr] }
exprs
: expr { trace "exprs 30" [$1] }
| exprs expr { trace "exprs 31" $ $2 : $1 }
现在我所有的测试在他们命中的第一个令牌上都失败了——parseExpr "\x7"
失败了:
uncaught exception: ErrorCall (Error processing token: TokenNonPrint '\a')
而且我非常困惑,因为我希望解析器能够走上这条路exprs -> expr -> nonprint -> NONPRINT
并成功。我不明白为什么这个输入会使解析器处于错误状态。没有任何trace
语句被命中(优化掉了?)。
我究竟做错了什么?