我正在解析一个文本文件,大小可能为几 GB,由以下行组成:

11 0.1
14 0.78
532 -3.5

基本上,每行一个 int 和一个 float。整数应该是有序的并且是非负的。我想验证数据是否如所述,并已将范围内的 min 和 max int 返回给我。这就是我想出的:

#include <iostream>
#include <string>

#include <boost/spirit/include/phoenix.hpp>
#include <boost/spirit/include/qi.hpp>
#include <boost/fusion/include/std_pair.hpp>

namespace px = boost::phoenix;
namespace qi = boost::spirit::qi;

namespace my_parsers
using namespace qi;
using px::at_c;
using px::val;
template <typename Iterator>
struct verify_data : grammar<Iterator, locals<int>, std::pair<int, int>()>
    verify_data() : verify_data::base_type(section)
            =  line(val(0))    [ at_c<0>(_val) = _1]
            >> +line(_a)       [ _a = _1]
            >> eps             [ at_c<1>(_val) = _a]

            %= (int_ >> other) [
                                   if_(_r1 >= _1)
                                       std::cout << _r1 << " and "
                                       << _1 << val(" out of order\n")

            = omit[(lit(' ') | '\t') >> float_ >> eol];
    rule<Iterator, locals<int>, std::pair<int, int>() > section;
    rule<Iterator, int(int)> line;
    rule<Iterator> other;

using namespace std;
int main(int argc, char** argv)
    string input("11 0.1\n"
                 "14 0.78\n"
                 "532 -3.6\n");

    my_parsers::verify_data<string::iterator> verifier;
    pair<int, int> p;
    std::string::iterator begin(input.begin()), end(input.end());
    cout << "parse result: " << boolalpha
         << qi::parse(begin, end, verifier, p) << endl; 
    cout << "p.first: " << p.first << "\np.second: " << p.second << endl;
    return 0;


  • 有没有更好的方法来解决这个问题?我使用了继承和合成的属性、局部变量和一点凤凰巫术。这很棒; 学习这些工具很好,但我不禁想到可能有一种更简单的方法来实现同样的事情:/(在 PEG 解析器中......)
  • 例如,没有局部变量怎么办?



2 回答 2



typedef std::pair<int, float> value_pair;

bool greater(const value_pair & left, const value_pair & right) {
    return left.first > right.first;

std::istream & operator>>(std::istream & stream, value_pair & value) {
    stream >> value.first >> value.second;
    return stream;


std::ifstream file("your_file.txt");
std::istream_iterator<value_pair> it(file);
std::istream_iterator<value_pair> eof;

if(std::adjacent_find(it, eof, greater) != eof) {
    std::cout << "The values are not ordered" << std::endl;


于 2011-06-23T07:05:13.807 回答


  • 低至 28 LOC
  • 没有更多的当地人
  • 不再有融合矢量at<>魔法
  • 没有更多的继承属性
  • 没有更多的语法课
  • 不再需要手动迭代
  • 使用期望点(参见other参考资料)来增强解析错误报告
  • vector<int>如果您选择分配它,这个解析器表达式会巧妙地合成为 a %=(但它会降低性能,除了可能分配一个较大的数组)


#include <boost/spirit/include/phoenix.hpp>
#include <boost/spirit/include/qi.hpp>

namespace px = boost::phoenix;
namespace qi = boost::spirit::qi;

typedef std::string::iterator It;

int main(int argc, char** argv)
    std::string input("11 0.1\n"
            "14 0.78\n"
            "532 -3.6\n");

    int min=-1, max=0;
        using namespace qi;
        using px::val;
        using px::ref;

        It begin(input.begin()), end(input.end());
        rule<It> index = int_ 
                if_(ref(max) < _1)  [ ref(max) = _1 ] .else_ [ std::cout << _1 << val(" out of order\n") ],
                if_(ref(min) <  0)  [ ref(min) = _1 ]
            ] ;

        rule<It> other = char_(" \t") > float_ > eol;

        std::cout << "parse result: " << std::boolalpha 
                  << qi::parse(begin, end, index % other) << std::endl; 
    std::cout << "min: " << min << "\nmax: " << max << std::endl;
    return 0;


我可能会建议将验证从表达式中取出并使其成为一个独立的函数;当然,这会让事情变得更加冗长(并且......清晰),我的脑残样本使用全局变量...... -但我相信你知道如何使用boost::bindpx::bind让它更真实


  • 即使使用免费功能,也可降至 27 LOC
  • 没有凤凰,没有凤凰包括(耶编译时间)
  • 调试构建中没有更多的凤凰表达式类型使二进制文件膨胀并减慢它的速度
  • 不再有var, ref, if_, .else_and the wretched (由于 phoenix.hpp 中未包含重载operator,,因此存在重大错误风险(有时))
  • 很容易移植到 c++0x lambda's - 立即消除对全局变量的需要


#include <boost/spirit/include/phoenix.hpp>
#include <boost/spirit/include/qi.hpp>
namespace px = boost::phoenix;
namespace qi = boost::spirit::qi;
typedef std::string::iterator It;

int min=-1, max=0, linenumber=0;
void validate_index(int index)
    if (min < 0)     min = index;
    if (max < index) max = index;
    else             std::cout << index << " out of order at line " << linenumber << std::endl;

int main(int argc, char** argv)
    std::string input("11 0.1\n"
            "14 0.78\n"
            "532 -3.6\n");
    It begin(input.begin()), end(input.end());

        using namespace qi;

        rule<It> index = int_ [ validate_index ] ;
        rule<It> other = char_(" \t") > float_ > eol;
        std::cout << "parse result: " << std::boolalpha 
                  << qi::parse(begin, end, index % other) << std::endl; 
    std::cout << "min: " << min << "\nmax: " << max << std::endl;
    return 0;
于 2011-06-23T07:30:50.883 回答