我想解析 html 文件中的所有链接标签。因此,为此我编写了以下正则表达式。
var pattern = @"<(LINK).*?HREF=(""|')?(?<URL>.*?)(""|')?.*?>";
var regExOptions = RegexOptions.Compiled | RegexOptions.IgnoreCase | RegexOptions.Multiline;
var linkRegEx = new Regex(pattern , regExOptions );
foreach (Match match in linkRegEx.Matches(htmlFile))
{
var group = match.Groups["URL"];
var url = group.Value;
}
但是发生的情况是我从 html 文件中找到了匹配项,但我得到了空白的捕获组。