我编写正则表达式以从 html 中获取所有 ref 链接
QRegExp bodylinksrx("(<a\\s+href\\s*=\\s*[^<>]*\\s*>[^<>]*</a>)");
QStringList bodylinks;
pos = 0;
while ((pos = bodylinksrx.indexIn(htmlcode, pos)) != -1)
{
bodylinks << bodylinksrx.cap(1);
pos += bodylinksrx.matchedLength();
}
我收到列表作为结果:
("<a href="http://somehref" class="someclass">href text...</a>", "<a href="http://somehref" class="someclass">href text...</a>", ......")
但我只需要接收列表"http://somehref" "href text..." "http://somehref" "href text..." ....