2

现在我可以通过WWW::Mechanize浏览网页并通过HTML::TreeBuilder::XPath通过访问 id获取信息,我只能使用Firebug读取 DOM 以发现 HTML 树的布局。Mechanize 捕获的内容是非结构化的 HTML,对人眼不利。

是否使用 Firebug 来确定我在典型方法后的身份?一旦我得到了 id,我就可以开始了,只是我有几个 id 和有更多 id 的页面要追查,我希望得到(转储、打印等)DOM 的格式化布局为了使发现更容易。尽管被授予,但 Firebug 也让它变得非常容易。我只是想知道我是否缺少更简单的方法。

在 PerlMonks 上交叉发布。

4

2 回答 2

3

如果您需要文本,xmllint --html --format(libxml2 附带)做得不错。

如果您想要一棵树并弄乱它并在 GUI 中测试各种表达式,那么Xacobeo是您最好的新朋友。

Xacobeo 截图

注意:由于这两个工具都依赖于 libxml,因此将HTML::TreeBuilder::XPath替换为HTML::TreeBuilder::LibXML以实现兼容性。这样,评估 XPath 也会更快。


如果您知道 Javascript/JQuery,那么还要安装FireQuery。然后,您可以在 FireBug 中测试 CSS 表达式,并将它们与通过 CSS 表达式选择 HTML 的模块一起使用,例如Web::Query

FireQuery 屏幕截图

于 2012-01-27T10:31:04.290 回答
0

我使用 Oxygen IDE 的 XML Developer 进行我最近在 XPath 上的开发: http ://www.oxygenxml.com/download.html 这是一个 30 天试用类型的工具,但您也可以搜索 XPath 可视化工具

据我所知,它并没有为您呈现一棵树(也许有一个面板可以做到这一点)。但它为您提供了一些智能完整的功能,可帮助您随时了解可用的节点。它对于 XPath 来说相当大,因为很难知道解析器支点真正指向的位置。

于 2012-01-27T04:51:51.333 回答