有一堆 HTML 文本提取工具。主要用于 Java 或 Python。我最常遇到的是锅炉管。这里和那里有一些 API,有些似乎工作得很好。有谁知道PHP中有什么可以做到这一点?
问问题
1021 次
2 回答
0
你可以试试phpQuery:
于 2012-07-07T22:35:06.987 回答
0
DomDocument是 PHP 中可用的一个类,如果您有 libxml 支持,可以解析 HTML 文档并让您遍历它们或发出XPath查询以查找 DOM 树中的特定节点。这是理想的方法。
或者,如果文本足够简单且统一,您可以使用preg_match()使用正则表达式从数据中提取文本。
于 2012-07-07T22:35:15.947 回答