我正在尝试提取“”中包含 /thumb/ 的所有链接。其实我只需要使用图像src。我不知道图片是否会以 jpg 结尾,或者是否会有区分大小写的问题等。我真的只关心完整的链接。
m = Regex.Match(page, @"""(.+?/thumbs/.+?)""");
//...
var thumbUrl = m.Groups[1].Value;
我的完整代码
var page = DownloadWebPage(url);
var reg = new Regex(@"Elements\s+\((.*)\)", RegexOptions.Multiline);
var m = reg.Match(page);
var szEleCount= m.Groups[1].Value;
int eleCount = int.Parse(szEleCount);
m = Regex.Match(page, @"""(.+?/thumbs/.+?)""");
while (m.Success)
{
var thumbUrl = m.Groups[1].Value;
//i break here to see a problem
m = m.NextMatch();
}
thumbUrl 看起来像
center\"> ... 很多文字,没有 /thumbs/ ... src=\" http://images.fdhkdhfkd.com/thumbs/dfljdkl/22350.jpg