我目前正在研究一种编程语言作为一种爱好。如果可以让 ocamllex 在找到它们时打印出它匹配的标记,这将使词法分析错误更容易调试,我有时只是手动将打印语句添加到我的规则中,但应该有一种更简单的方法来做到这一点。
所以我要问的是,给定一个 .mll 文件和一些输入,是否有一种自动方式来查看相应的令牌?
我不认为有一种内置方法可以要求词法分析器打印其标记。
如果您使用 ocamlyacc,您可以设置p
选项OCAMLRUNPARAM
以查看解析器操作的跟踪。这在 OCaml 手册的第 12.5 节中有描述。参见第 10.2 节的描述OCAMLRUNPARAM
。
如果您不介意粗略的 hack,我只是编写了一个小脚本lext
,将跟踪添加到 ocamllex 生成的输出中:
#!/bin/sh
#
echo '
let my_engine a b lexbuf =
let res = Lexing.engine a b lexbuf in
Printf.printf "Saw token [%s]'\\\\'n" (Lexing.lexeme lexbuf);
res
'
sed 's/Lexing\.engine/my_engine/g' "$@"
它是这样工作的:
$ cat ab.mll
rule token = parse
[' ' '\t'] { token lexbuf }
| '\n' { 1 }
| '+' { 2 }
| _ { 3 }
{
let lexbuf = Lexing.from_channel stdin in
try
while true do
ignore (token lexbuf)
done
with _ -> exit 0
}
$ ocamllex ab.mll
5 states, 257 transitions, table size 1058 bytes
$ lext ab.ml > abtraced.ml
$ ocamlopt -o abtraced abtraced.ml
$ echo 'a+b' | abtraced
Saw token []
Saw token [a]
Saw token [+]
Saw token [b]
Saw token [
]
Saw token []