我正在处理一个完整的 html 文档,我需要提取 url,但前提是匹配所需的域
<html>
<div id="" class="">junk
<a href="http://example.com/foo/bar">example.com</a>
morejunk
<a href="http://notexample.com/foo/bar">notexample.com</a>
</div>
</html>
从那个垃圾部分,我需要获取 example.com 的完整 url,而不是其余部分 (notexample.com)。那将是“http://example.com/foo/bar”甚至更好,只有那个 url (bar) 女巫的最后一部分当然每次都会不同。
希望我已经足够清楚了,非常感谢!
编辑:使用 php