2

我喜欢从 html 字符串中获取锚标记定义中的 url。html 的结构相当好,但我试图收集的字符串包含谷歌地图的地址,并且可能非常不同。我正在尝试使用 preg_match_all 获取所有匹配的 url。

<tr><td><a href="http://maps.google.com/maps?q=4165 E LIVE OAK AVE,">map</a></td></tr>
<tr><td><a href="http://maps.google.com/maps?q=8000 SUNSET BLVD, LOS ANGELES,">map</a></td></tr>
<tr><td><a href="http://maps.google.com/maps?q=30600 THOUSAND OAKS BLVD, AGOURA,">map</a></td></tr>
<tr><td><a href="http://maps.google.com/maps?q=9090 19TH ST, ALTA LOMA,">map</a></td></tr>
<tr><td><a href="http://maps.google.com/maps?q=185 W ALTADENA DR, ALTADENA,">map</a></td></tr>
<tr><td><a href="http://maps.google.com/maps?q=620 E MOUNT CURVE AVE,">map</a></td></tr>
4

1 回答 1

1

试试下面的正则表达式:

/http:\/\/maps.google.com\/maps\?q[^"]+(?=")/

但是该页面可能包含您提供的 HTML 结构之外的类似 URL,那么最好使用更复杂的正则表达式:

/(?<=<tr><td><a href=")http:\/\/maps.google.com\/maps\?q[^"]+(?=">map<\/a><\/td><\/tr>)/
于 2013-04-21T20:27:13.077 回答