3

有一堆 HTML 文本提取工具。主要用于 Java 或 Python。我最常遇到的是锅炉管。这里和那里有一些 API,有些似乎工作得很好。有谁知道PHP中有什么可以做到这一点?

4

2 回答 2

0

你可以试试phpQuery:

http://code.google.com/p/phpquery/

于 2012-07-07T22:35:06.987 回答
0

DomDocument是 PHP 中可用的一个类,如果您有 libxml 支持,可以解析 HTML 文档并让您遍历它们或发出XPath查询以查找 DOM 树中的特定节点。这是理想的方法。

或者,如果文本足够简单且统一,您可以使用preg_match()使用正则表达式从数据中提取文本。

于 2012-07-07T22:35:15.947 回答