3

我一直在开发 Java 程序,通过使用各种 html 解析器(如 Jericho、NekoHtml 等)来解析网页的 html 源代码......

现在我想用 PHP 语言开发解析器。所以在开始之前,我想知道是否有任何可用的 html 解析器可以与 PHP 一起使用来解析 html 代码

4

3 回答 3

2

内置类DOM 解析器做得非常好。还有许多其他xml 解析器

于 2010-02-17T14:56:15.483 回答
2

查看DOMDocument

Example #1 创建一个文档

<?php
$doc = new DOMDocument();
$doc->loadHTML("<html><body>Test<br></body></html>");
echo $doc->saveHTML();
于 2010-02-17T14:58:02.290 回答
1

DOM 非常适合这一点。它也可以处理无效标记,但是,如果标记不完美,它会抛出未记录的错误和异常,因此我建议您在使用 DOM 加载 HTML 之前使用 HTMLPurifier 或其他库过滤 HTML。

于 2010-02-17T15:39:43.947 回答