可能重复:
如何使用 PHP 解析和处理 HTML?
我正在学习 PHP,当我必须从没有可用 API 的网页中提取(解析)一些数据时,我使用正则表达式或一个函数来获取两个字符串之间的字符串。
我想知道是否有更“专业”、更简单的方法来做到这一点,因为 regexp 是资源消耗,而不是现在对我来说最容易写的东西。
可能重复:
如何使用 PHP 解析和处理 HTML?
我正在学习 PHP,当我必须从没有可用 API 的网页中提取(解析)一些数据时,我使用正则表达式或一个函数来获取两个字符串之间的字符串。
我想知道是否有更“专业”、更简单的方法来做到这一点,因为 regexp 是资源消耗,而不是现在对我来说最容易写的东西。
您永远不应该尝试使用正则表达式解析 XML ( html ) ,而应该为自己准备一个合适的 XML 解析器库并以正确的方式进行。我可能听起来像是一项艰巨的任务,但你最终会感谢自己。
可以使用以下资源之一或类似资源来完成解析。
关于 html 和正则表达式的流行和传奇答案,值得一读的诗歌:
PHP 带有一个默认的 XML 解析库,供您在这种特定情况下使用。用于file_get_contents
检索 HTML 页面并进行相应的解析。
XML: http: //php.net/manual/en/book.xml.php
文件获取内容: http : //php.net/manual/en/function.file-get-contents.php