1

可能重复:
如何使用 PHP 解析和处理 HTML?

我正在学习 PHP,当我必须从没有可用 API 的网页中提取(解析)一些数据时,我使用正则表达式或一个函数来获取两个字符串之间的字符串。

我想知道是否有更“专业”、更简单的方法来做到这一点,因为 regexp 是资源消耗,而不是现在对我来说最容易写的东西。

4

2 回答 2

1

您永远不应该尝试使用正则表达式解析 XML ( html ) ,而应该为自己准备一个合适的 XML 解析器库并以正确的方式进行。我可能听起来像是一项艰巨的任务,但你最终会感谢自己。

可以使用以下资源之一或类似资源来完成解析。


关于 html 和正则表达式的流行和传奇答案,值得一读的诗歌:

于 2012-07-17T19:53:28.200 回答
1

PHP 带有一个默认的 XML 解析库,供您在这种特定情况下使用。用于file_get_contents检索 HTML 页面并进行相应的解析。

XML http: //php.net/manual/en/book.xml.php

文件获取内容: http : //php.net/manual/en/function.file-get-contents.php

于 2012-07-17T19:54:32.130 回答