perl - 如何可视化/漂亮地打印 HTML DOM 树？

Question

现在我可以通过WWW::Mechanize浏览网页并通过HTML::TreeBuilder::XPath通过访问 id获取信息，我只能使用Firebug读取 DOM 以发现 HTML 树的布局。Mechanize 捕获的内容是非结构化的 HTML，对人眼不利。

是否使用 Firebug 来确定我在典型方法后的身份？一旦我得到了 id，我就可以开始了，只是我有几个 id 和有更多 id 的页面要追查，我希望得到（转储、打印等）DOM 的格式化布局为了使发现更容易。尽管被授予，但 Firebug 也让它变得非常容易。我只是想知道我是否缺少更简单的方法。

score 3 · Accepted Answer

如果您需要文本，xmllint --html --format（libxml2 附带）做得不错。

如果您想要一棵树并弄乱它并在 GUI 中测试各种表达式，那么Xacobeo是您最好的新朋友。

Xacobeo 截图

注意：由于这两个工具都依赖于 libxml，因此将HTML::TreeBuilder::XPath替换为HTML::TreeBuilder::LibXML以实现兼容性。这样，评估 XPath 也会更快。

如果您知道 Javascript/JQuery，那么还要安装FireQuery。然后，您可以在 FireBug 中测试 CSS 表达式，并将它们与通过 CSS 表达式选择 HTML 的模块一起使用，例如Web::Query。

FireQuery 屏幕截图

score 0 · Accepted Answer

我使用 Oxygen IDE 的 XML Developer 进行我最近在 XPath 上的开发： http ://www.oxygenxml.com/download.html 这是一个 30 天试用类型的工具，但您也可以搜索 XPath 可视化工具

据我所知，它并没有为您呈现一棵树（也许有一个面板可以做到这一点）。但它为您提供了一些智能完整的功能，可帮助您随时了解可用的节点。它对于 XPath 来说相当大，因为很难知道解析器支点真正指向的位置。

2 回答 2