10

我在玩 Boost.Regex 来解析单词和数字的字符串。这是我到目前为止所拥有的:

#include <iostream>
#include <string>
#include <boost/foreach.hpp>
#include <boost/regex.hpp>
#include <boost/range.hpp>

using namespace std;
using namespace boost;

int main()
{
    regex re
    (
        "("
            "([a-z]+)|"
            "(-?[0-9]+(\\.[0-9]+)?)"
        ")"
    );

    string s = "here is a\t list of Words. and some 1239.32 numbers to 3323 parse.";
    sregex_iterator m1(s.begin(), s.end(), re), m2;

    BOOST_FOREACH (const match_results<string::const_iterator>& what, make_iterator_range(m1, m2)) {
        cout << ":" << what[1].str() << ":" << what.position(1) << ":" << what.length(1) << endl;
    }

    return 0;
}

有没有办法告诉正则表达式从流而不是字符串解析?似乎应该可以使用任何迭代器。

4

3 回答 3

5

Boost.IOStreams 有一个regex_filter允许对流执行相当于 regex_replace 的操作。但是,从实现来看,它似乎“作弊”,因为它只是将整个流加载到缓冲区中,然后在该缓冲区上调用 Boost.Regex。

可以通过Boost.Regex的“部分匹配”支持对流的内容进行正则表达式搜索,而不必将其完全加载到内存中。查看页面末尾的示例。

于 2009-02-09T20:16:04.800 回答
2

regex_iterator 构造函数需要双向迭代器,但 std::istream_iterator 只是一个 InputIterator,因此您似乎无法对任何标准流类和/或对象(cin、ifstream 等)执行此操作。如果您有一个暴露双向迭代器的自定义流,它应该可以工作。

于 2009-01-19T15:23:46.960 回答
1

有限状态机需要能够“备份”,以防它现在尝试的失败。这对于无法“备份”的输入迭代器来说是不可能的。

于 2011-12-20T07:29:38.330 回答