6

我在用

boost::split(strs, r_strCommandLine, boost::is_any_of("\t "));

将字符串吐入标记以解析简单脚本。到现在为止还挺好。但是,对于以下字符串

command_name first_argument "Second argument which is a quoted string." 

我希望我的代币是

strs[0] = command_name
strs[1] = first_argument
strs[2] = "Second argument which is a quoted string." 

当然,我可以在标记的开头和结尾搜索引号字符,并使用“”分隔以引号开头的标记和以引号结尾的标记之间的标记以重新创建带引号的字符串,但我想知道如果有更有效/优雅的方式来做到这一点。有任何想法吗?

4

2 回答 2

15

使用示例boost::tokenizer

#include <string>
#include <iostream>
using std::cout;
using std::string;

#include <boost/tokenizer.hpp>
using boost::tokenizer;
using boost::escaped_list_separator;

typedef tokenizer<escaped_list_separator<char> > so_tokenizer;

int main()
{
    string s("command_name first_argument "
             "\"Second argument which is a quoted string.\"");

    so_tokenizer tok(s, escaped_list_separator<char>('\\', ' ', '\"'));
    for(so_tokenizer::iterator beg=tok.begin(); beg!=tok.end(); ++beg)
    {
        cout << *beg << "\n";
    }

    return 0;
}

输出:

命令名
first_argument
第二个参数是带引号的字符串。

请参阅https://ideone.com/gwCpug上的演示。

于 2012-11-15T21:42:23.030 回答
0

我不确定这个解决方案是否可移植(我们违反了 const 条件bool operator() (char ch) const),但它可以工作。

这个解决方案在理论上很有趣,我不会在实际项目中使用它。

#include <boost/algorithm/string/split.hpp>
#include <string>
#include <vector>
#include <iostream>

class split_q {
public:
    split_q() : in_q(false) {}
    bool operator() (char ch) const
    {
        if (ch == '\"') in_q = !in_q;
        return !in_q && ch == ' ';
    }

private:
    mutable bool in_q;

};

int main(int argc, char* argv[])
{
    std::string in = "command_name first_argument \"Second argument which is a quoted string.\" additional_argument";
    std::vector<std::string> res;
    boost::algorithm::split(res, in, split_q());

    for (size_t i = 0; i < res.size(); ++i)
        std::cout << res[i] << std::endl;

    return 0;
}

结果:

command_name
first_argument
"Second argument which is a quoted string."
additional_argument
于 2012-11-15T21:37:58.490 回答