旧的工作模式,直到网站更改其托管文件的方式。
http[s]?://[0-9a-z_.-]+\.[a-z]{2,4}[:0-9]*/([0-9a-z_./-])*[0-9a-z _.-](?:jpg|bmp|gif|png)+
我不知道如何编写有效的正则表达式来匹配 url 模式以从网页中提取图像。
我想要精确的图像字符串具有这种模式:
images.domain.com/1/src/1333849327175.jpg
images.domain.com/2/src/2311487564321.png
images.domain.com/a/src/4568436431234.gif
images.domain.com/b/src/1234237456466.jpeg
images.domain.com/abc12/src/123456466.bmp
还有很多其他图片,所以我只想要那些符合 images.domain.com 模式的图片
我只是无法绕过它!试过这个,但有没有简单的方法来测试它?
images[0-9a-z_.-]+\.[a-z]{2,4}[:0-9]*/([0-9a-z_./-])*[0-9a-z _.-](?:jpg|bmp|gif|png)+