我正在使用正则表达式从 html 页面中的 div 之间检索字符串,但是我遇到了内存不足错误。我正在使用 Visual Studio 2012 和 C++。
正则表达式 is"class=\"ListingDescription\">((.*|\r|\n)*?(?=</div>))"
并且 regxbuddy 估计它需要 242 步(比原来的 ~5000 步要好得多)。我试图从中删除信息的网站是http://www.trademe.co.nz/Browse/Listing.aspx?id=557211466
这是代码:
typedef match_results<const char*> cmatch;
tr1::cmatch results;
try {
tr1::regex regx("class=\"ListingDescription\">((.*|\\r|\\n)*?(?=</div>))");
tr1::regex_search(data.c_str(), results, regx);
cout << result[1];
}
catch (const std::regex_error& e) {
std::cout << "regex_error caught: " << e.what() << '\n';
if (e.code() == std::regex_constants::error_brack) {
std::cout << "The code was error_brack\n";
}
}
这是我得到的错误:
regex_error caught: regex_error(error_stack): There was insufficient memory to d
etermine whether the regular expression could match the specified character sequ
ence.
Regexbuddy 工作正常,一些在线正则表达式工具也能正常工作,但不是我的代码 :( 请帮助