<img src="http://Some_image.png" alt="somethingIdonotneed"
任务:仅对图像位进行分组(src="this stuff.png"
),忽略其余部分
另外,由于某种原因,在我发现这个的 HTML 中,没有</img>
. 我以为所有标签都关闭了?
谢谢
<img src="http://Some_image.png" alt="somethingIdonotneed"
任务:仅对图像位进行分组(src="this stuff.png"
),忽略其余部分
另外,由于某种原因,在我发现这个的 HTML 中,没有</img>
. 我以为所有标签都关闭了?
谢谢
这里的快速修复是
/img\s+(src="[^"]+")/
我强烈建议您不要使用正则表达式来解析 HTML。
此外,这是一个自闭合(“void”)标签列表。即,它们不需要</...>
结束标签。
<area>
<base>
<basefont>
<br>
<col>
<command>
<embed>
<hr>
<input>
<img>
<keygen>
<link>
<meta>
<param>
<source>
<track>
<wbr>
试试这个,
/img[^>]+?(src\s*=\s*\"[^\"]*\")/i
你应该得到第一组。
此正则表达式将捕获(整个,无组)您想要的内容:
(?<=<img )src="[^"]+"