2

我的程序检索 HTML 页面内容,然后在页面中查找 jpg 图像链接。

我想使用正则表达式来捕捉图像但是我在这里遇到了问题..

为了做到这一点,我使用了模式

“http.*?jpg”

但这让我捕捉到了这样的表达:“http://someURL...http://imageURL.jpg”

所以我想我想找到的是最短匹配,即找到“jpg”并向后看第一个“http”

是否可以使用正则表达式?

4

2 回答 2

3

尝试http:[^:]*?jpg这是一种 hacky 方法,以确保您只有一个分号,因此只有一个 http: 块,您可以进一步选择 url 的常用分隔符

http:[^:\"\}\{\s]*?\.jpg

于 2012-06-06T18:29:53.683 回答
0

如何使用基于负前瞻的正则表达式来确保最短的文本在http://和 .jpg` 之间匹配,如下所示:

/http:\/\/(?!.*?http:\/\/).+?\.jpe?g/
于 2012-06-06T18:51:33.050 回答