2

我正在尝试编写一个程序来理解允许嵌入注释的语言。如:

/* Here's a comment
  /* This comment is further embedded */ second comment is closed
Must close first comment */

这应该被识别为评论(因此不会在它看到的第一个 */ 处停止,除非它之前只看到 1 条评论打开)。

这将是一个在 C 中很容易解决的问题,我可以简单地设置一个计数器,当它看到评论打开时递增,当看到评论关闭时递减。如果计数器为 0,我们就在“代码部分”。

然而,在 Haskell 中没有状态,它更具挑战性。

我已经阅读了 monadUserState ,据说它允许跟踪这种确切类型的解析的状态。但是,除了alex 上的教程页面之外,我找不到太多关于它的阅读材料。

当我尝试编译时,它给出了错误

templates\wrappers.hs:213:16: Not in scope: `alexEOF`

需要注意的是,我直接从“基本”包装器更改为“monadUserState”,而没有更改我的代码(我不知道要添加什么才能使用它)。它说这必须在用户代码中初始化:

data AlexState = AlexState {
        alex_pos :: !AlexPosn,  -- position at current input location
        alex_inp :: String,     -- the current input
        alex_chr :: !Char,      -- the character before the input
        alex_bytes :: [Byte],   -- rest of the bytes for the current char
        alex_scd :: !Int,       -- the current startcode
        alex_ust :: AlexUserState -- AlexUserState will be defined in the     user program
    }

我有点像 lexxing 菜鸟,我完全不确定我应该在这里添加什么以使其至少可以编译......然后我可以担心事情的逻辑。

4

1 回答 1

2

更新:此处提供的工作示例:http: //lpaste.net/119212

alex github repo 中的文件“tiger.x” (链接)包含如何使用 monadUserState 包装器跟踪嵌入评论的示例。

好吧,不幸的是,该示例无法编译,但那里的想法应该可行。

基本上,这些行执行嵌入式注释处理:

<0>             "/*"         { enterNewComment `andBegin` state_comment }
<state_comment> "/*"         { embedComment }
<state_comment> "*/"         { unembedComment }
<state_comment> .            ;
<state_comment> \n           { skip }

至于alexEOF,这个想法是在您的令牌数据类型中添加一个 EOF 令牌:

data Tokens = ... | EOF

并定义alexEOF为:

alexEOF = return EOF

有关此示例,请参阅 alex 存储库中的文件 tests/tokens_monadUserState_bytestring.x。

于 2015-01-25T22:58:26.257 回答