我只使用了 Boost.Spirit(来自 Boost 1.44)三天,试图通过 RFC2822 中的确切语法来解析原始电子邮件消息。我以为我开始理解它并到达某个地方,但后来我遇到了一个问题:
#include <iostream>
#include <boost/spirit/include/qi.hpp>
namespace qi = boost::spirit::qi;
using qi::omit;
using qi::repeat;
using std::cout;
using std::endl;
typedef qi::rule<std::string::const_iterator, std::string()> strrule_t;
void test(const std::string input, strrule_t rule) {
std::string target;
std::string::const_iterator i = input.begin(), ie = input.end();
if (qi::parse(i, ie, rule, target)) {
cout << "Success: '" << target << "'" << endl;
} else {
cout << "Failed to match." << endl;
}
}
int main() {
strrule_t obsolete_year = omit[-qi::char_(" \t")] >> repeat(2)[qi::digit] >>
omit[-qi::char_(" \t")];
strrule_t correct_year = repeat(4)[qi::digit];
test("1776", correct_year | repeat(2)[qi::digit]); // 1: Works, reports 1776.
test("76", obsolete_year); // 2: Works, reports 76.
test("76", obsolete_year | correct_year); // 3: Works, reports 76.
test(" 76", correct_year | obsolete_year); // 4: Works, reports 76.
test("76", correct_year | obsolete_year); // 5: Fails.
test("76", correct_year | repeat(2)[qi::digit]); // 6: Also fails.
}
如果测试#3 有效,那么为什么测试#5——与两个替代方案完全相同的测试——会失败?
出于同样的原因,如果你会原谅这个表达式:如果测试#4有效,并且开头的空格被标记为可选,那么为什么测试#5(完全相同的测试具有完全相同的输入,除了有输入中没有前导空格)失败?
最后,如果这是 Boost.Spirit 中的一个错误(我怀疑它一定是),我该如何解决它?