4

我编写了一个解析器来查找字符串连接表达式。我有一系列用括号括起来的字符串,主要来自函数调用。

例如,("one"+"two"+"three") -> ("one"|"two"|"three")是一个简单的案例,我可以处理它。

一个更困难的情况是(null, "one"+"two"+"three", null) -> (null, "one"|"two"|"three", null),但我可以用boost::tokenizer.

(null, "one"+"two"+"three,four", 1 /* third parameter can be: 1, 2, 3 */),在这样一个困难的例子中,我建议解析,boost::spirit但我需要帮助来编写一些规则。

之后:

似乎escaped_list_separatorboost::tokenizer我需要的。但我有一个问题:

   using namespace std;
   using namespace boost;
   string s = "Field 1,\"putting quotes around fields, allows commas\",Field 3";
   tokenizer<escaped_list_separator<char> > tok(s,escaped_list_separator<char>("", ",", "\""));
   for(tokenizer<escaped_list_separator<char> >::iterator beg=tok.begin(); beg!=tok.end();++beg){
       cout <<"~~~"<< *beg << "\n";
   }

为我删除"。可以像这样在输出中保留引号

Field 1
"putting quotes around fields, allows commas"
Field 3
4

1 回答 1

2

基本上,您可以使用operator-字符集匹配:

   rule = '"' >> (char_ - '"') >> '"';

另请查看operator ~反转字符集。

如果您也有兴趣在引号内转义引号,并且可能同时评论样式,我建议您在此处查看我的答案:

在 CSV 文件中显示(部分)引用的单元格,包括字符串中的转义引号。

其他感兴趣的项目:

于 2012-05-24T09:55:28.357 回答