可能重复:
如何使用 PHP 解析和处理 HTML?
我正在编写一个脚本,该脚本应该废弃页面的 html 并在页面上找到“联系”或“联系我们”网址。所以我拥有的是 url,我能够使用 curl 获取页面的 html。
现在我需要做的就是找到联系链接并尝试提取电子邮件地址和电话号码。
我的问题是我如何喜欢联系网址?我应该寻找什么?也许链接文本应该包含单词contact,或者url应该包含单词contact?正则表达式会是什么样子?
其次,我认为一旦我有了联系页面,我应该能够在线找到一个正则表达式,它将提取电子邮件地址和电话号码。所以我只需要找到联系链接。我正在抓取的这些页面是博客。