我已经重写了这个问题,因为它最初是用一个更简洁的代码示例发布的:
考虑一种具有完全可选分号的语言,几乎完全是糖,即:
;; foo; bar;;;;
已验证foo bar foobar
已验证if (+1); foo
与if (+1) foo
语义不同,因此;
不能视为空格
这是一个示例解析器:
{-# LANGUAGE OverloadedStrings #-}
import Text.Trifecta
import Text.Trifecta.Delta
import Text.PrettyPrint.ANSI.Leijen (putDoc, (<>), linebreak)
import Control.Monad.Trans.State.Strict
import Control.Applicative
type TestParser a = StateT Int Parser a
data AST a = Foo a | Bar a deriving (Show)
pFoo :: TestParser (AST (Delta, Int))
pFoo = curry Foo <$ string "foo" <*> position <* modify (+1) <*> get
pBar :: TestParser (AST (Delta, Int))
pBar = curry Bar <$ string "bar" <*> position <*> get
pStmt :: TestParser (AST (Delta, Int))
pStmt = semi *> pStmt <|> pFoo <|> pBar <?> "statement"
pTest :: TestParser [AST (Delta, Int)]
pTest = some pStmt
main :: IO ()
main
= do let res = parseByteString (evalStateT pTest 0)
(Directed "(test)" 0 0 0 0) ";;foo;bar;\nfoo;; foobarbar;;"
case res of
Success ast
-> print ast
Failure errdoc
-> putDoc (errdoc <> linebreak)
我在使用这种解析器时遇到的问题是我需要能够跳过分号而不承诺解析pStmt
. 目前出现以下错误:
(test):2:18: error: unexpected
EOF, expected: statement
foo;; foobarbar;;<EOF>
这是因为它需要一个语句 (in semi *> pStmt
),但是因为堆叠的分号可以在表达式的开头和结尾都加糖,所以我不能确定我真的想要在我已经期望一个之前期望/解析一个。
我开发的一个 hack 是Nop
在我的 AST 中作为构造函数,但我真的不想这样做 - 感觉就像是一个 hack,并且某些文档中的分号数量会大大增加内存使用量。
我正在寻找解决方案/建议。
尝试所需语法的 EBNF 形式:
expr = "foo" | "bar"
expr with sugar = expr | ";"
program = { [white space], expr with sugar, [white space] }