javascript - 未返回预期图像的正则表达式

Question

我使用以下正则表达式在提要的标签中搜索图像：

var str=items.item(i).getElementsByTagName("content:encoded").item(0).text;
var patt1=/([a-z\-_0-9\/\:\.]*\.(jpg|jpeg|png|gif))/i
var urlMatch = str.match(patt1);

然后，我在以下标签内打印到控制台 urlMatch[0] 、 urlMatch[1] 和 urlMatch[2] ：

<![CDATA[
<p><a href="http://www.highlandradio.com/wp-content/uploads/2013/08/Emergency.jpg"><img class="alignleft size-thumbnail wp-image-56646" alt="Emergency" src="http://www.highlandradio.com/wp-content/uploads/2013/08/Emergency-150x150.jpg" width="150" height="150" /></a></p> <p><strong>The HSE has confi
]]>

这分别返回以下 3 个结果：

http://www.highlandradio.com/wp-content/uploads/2013/08/Emergency.jpg,
http://www.highlandradio.com/wp-content/uploads/2013/08/Emergency.jpg, 
jpg.

有人可以向我解释发生了什么吗？为什么我没有得到名称中带有 150x150 的那个？这是我需要的。提前感谢您的帮助

score 2 · Accepted Answer

您为第一个匹配获得多个组，而不是多个匹配。这意味着，urlMatch[0]是匹配，urlMatch[1]是第一个捕获组（第一组括号，顺便与整个匹配相同），并且urlMatch[2]是您的模式中的第二组括号（您已经包裹了文件扩展名）。

您需要使用全局g标志：

var patt1=/([a-z\-_0-9\/\:\.]*\.(jpg|jpeg|png|gif))/ig;
var urlMatch = str.match(patt1);

导致：

[
  "http://www.highlandradio.com/wp-content/uploads/2013/08/Emergency.jpg",
  "http://www.highlandradio.com/wp-content/uploads/2013/08/Emergency-150x150.jpg"
]

如果您确实需要捕获组（除了所有匹配项），则必须使用RegExp.exec().

如果没有，您可以使用非捕获组来提高性能。请注意，在任何情况下您都不需要外括号，因此无论如何您都可以省略。使用非捕获组，这看起来像：

var patt1 = /[a-z\-_0-9´\/:.]*\.(?:jpg|jpeg|png|gif)/ig;

javascript - 未返回预期图像的正则表达式

1 回答 1

Related

Reference