6

我只使用了 Boost.Spirit(来自 Boost 1.44)三天,试图通过 RFC2822 中的确切语法来解析原始电子邮件消息。我以为我开始理解它并到达某个地方,但后来我遇到了一个问题:

#include <iostream>
#include <boost/spirit/include/qi.hpp>

namespace qi = boost::spirit::qi;
using qi::omit;
using qi::repeat;
using std::cout;
using std::endl;

typedef qi::rule<std::string::const_iterator, std::string()> strrule_t;

void test(const std::string input, strrule_t rule) {
    std::string target;
    std::string::const_iterator i = input.begin(), ie = input.end();

    if (qi::parse(i, ie, rule, target)) {
        cout << "Success: '" << target << "'" << endl;
    } else {
        cout << "Failed to match." << endl;
    }
}

int main() {
    strrule_t obsolete_year = omit[-qi::char_(" \t")] >> repeat(2)[qi::digit] >>
        omit[-qi::char_(" \t")];
    strrule_t correct_year = repeat(4)[qi::digit];

    test("1776", correct_year | repeat(2)[qi::digit]); // 1: Works, reports 1776.
    test("76",   obsolete_year);                       // 2: Works, reports 76.
    test("76",   obsolete_year | correct_year);        // 3: Works, reports 76.
    test(" 76",  correct_year | obsolete_year);        // 4: Works, reports 76.
    test("76",   correct_year | obsolete_year);        // 5: Fails.
    test("76",   correct_year | repeat(2)[qi::digit]); // 6: Also fails.
}

如果测试#3 有效,那么为什么测试#5——与两个替代方案完全相同的测试——会失败?

出于同样的原因,如果你会原谅这个表达式:如果测试#4有效,并且开头的空格被标记为可选,那么为什么测试#5(完全相同的测试具有完全相同的输入,除了有输入中没有前导空格)失败?

最后,如果这是 Boost.Spirit 中的一个错误(我怀疑它一定是),我该如何解决它?

4

1 回答 1

7

那是因为你在 Spirit 的指令中遇到了一个错误repeat[]。感谢您的报告,我在 SVN (rev. [66167]) 中修复了这个问题,它将在 Boost V1.45 中可用。同时,我想将您的小测试作为回归测试添加到 Spirit 的测试套件中。我希望你不介意我这样做。

于 2010-10-24T22:32:33.080 回答