在 php 中,我正在从我的其他外部站点之一中抓取一些 html。我正在执行抓取并在 php 字符串中获取所有页面 html。我需要在这个字符串中找到第一个 .png 文件类型。然后我需要从这一点抓取 html 以在它之前找到开始的 http 并在以下字符开始“\u002522”之前抓取它之后的 html。有任何想法吗?
所以:
<html><head><title>Hello</title></head><body><p>Here's a nice image</p><img src="http://www.exampleurl.com/image.png?id=35435646&v=5647\\u002522"/></body></html>
会变成:
http://www.exampleurl.com/image.png?id=35435646&v=5647
我到处寻找同时结合所有这些东西,但没有运气:(