0

我需要从 HTML 文件中提取所有标签,这样我最终会得到一个包含每个属性的 key=value 的数组,或者至少是组成标签的原始文本。

我不太喜欢正则表达式,更不用说 PHP,所以我真的很感激这方面的一些帮助。

PD:一些标签可能跨越多行,并在后续行中使用制表符和空格缩进。

谢谢。

4

3 回答 3

1

您可以使用DOM 函数将 XML/XHTML 文档解析为 DOM 树。从那里遍历您想要的节点并提取您正在寻找的数据并不难。

有些人更喜欢SimpleXML 函数,它们可能对您同样适用。我个人对 SimpleXML 有疑问,我更喜欢更冗长但更强大的 DOM 函数。

于 2009-09-05T00:04:32.113 回答
1

是的,很容易。使用 PHP 的 DOM-Function 并尝试使用 XPath 查找节点。那应该是无痛的方式。

于 2009-09-05T00:15:53.993 回答
0

另一种选择是simplehtmldom库。

于 2009-09-05T00:29:28.053 回答