0

我需要编写一个解析器来解析命令。5个这样的命令是:

"a=10"
"b=foo"
"c=10,10"
"clear d"
"c push_back 2"

在第一个示例中,set 是命令,a 是对象,10 是值。

你认为解析器应该为上面的每一行返回什么?

这是我的想法:

   "a=10" -> SET (COMMAND_ENUM), INT (VALUE_TYPE), "a", ("10")
   "b=foo" -> SET (COMMAND_ENUM), STRING (VALUE_TYPE), "b", ("foo")

这是一个好方法吗?这个问题的标准方法是什么?我应该派人代替吗?

我有一个检查与对象关联的类型的函数。例如,a上面是类型INT并且必须分配一个INT值,否则解析器应该返回或抛出某种错误。我还有一个转换函数,用于将值从字符串转换为所需的类型。如果无法进行转换,则会抛出这些。如果解析器试图将值从字符串转换为所需的类型,那么通过 boost::variant 返回它们可能是个好主意。

4

1 回答 1

1

你需要为你想要识别的命令语言至少想出一个半正式的语法,因为你已经留下了很多模糊的东西(例如,b=foo你想b成为一个变量名但foo成为一个字符串字面量。你如何区分它们?如果一个字符序列在赋值的右侧表示一个标识符,但如果它在左侧则表示一个字面量?还是单个字符表示一个标识符,但多个字符表示文字?) Inc=10,10表示10,10列表还是向量?写一个语法至少会迫使你思考这些事情,它也至少可以作为如何编写你的解析器的指南(最多它会是可以自动翻译到你的解析器中的东西)。

通过思考语句应该如何表示为抽象语法树 (AST),您走在了正确的轨道上,但是您需要退后一步,从具体语法的角度来看您想要什么。

于 2012-09-19T12:45:13.653 回答