我一直在开发 Java 程序,通过使用各种 html 解析器(如 Jericho、NekoHtml 等)来解析网页的 html 源代码......
现在我想用 PHP 语言开发解析器。所以在开始之前,我想知道是否有任何可用的 html 解析器可以与 PHP 一起使用来解析 html 代码
我一直在开发 Java 程序,通过使用各种 html 解析器(如 Jericho、NekoHtml 等)来解析网页的 html 源代码......
现在我想用 PHP 语言开发解析器。所以在开始之前,我想知道是否有任何可用的 html 解析器可以与 PHP 一起使用来解析 html 代码
查看DOMDocument。
Example #1 创建一个文档
<?php
$doc = new DOMDocument();
$doc->loadHTML("<html><body>Test<br></body></html>");
echo $doc->saveHTML();
DOM 非常适合这一点。它也可以处理无效标记,但是,如果标记不完美,它会抛出未记录的错误和异常,因此我建议您在使用 DOM 加载 HTML 之前使用 HTMLPurifier 或其他库过滤 HTML。