我想创建一个正则表达式,它将匹配<a>
仅包含 href 属性的开始标记:
<a href="doesntmatter.com">
它应该与上述匹配,但在添加其他属性时不匹配:
<a href="doesntmatter.com" onmouseover="alert('Do something evil with Javascript')">
通常这很容易,但 HTML 是经过编码的。所以对上述两种编码,我需要正则表达式来匹配这个:
<a href="doesntmatter.com" >
但不匹配这个:
<a href="doesntmatter.com" onmouseover="alert('do something evil with javascript.')" >
假设所有编码的 HTML 都是“有效的”(没有奇怪的畸形 XSS 诡计),并假设我们不需要遵循任何 HTML 清理最佳实践。我只需要最简单的正则表达式来匹配上面的 A) 但不匹配 B)。
谢谢!