我试图找出在 Perl 中使用 HTML::TreeBuilder 从 XML 文件中的某些 HTML 中提取几段文本的最佳方法。
我一直在使用它$tree->address
(或者我认为是这样),直到我意识到并非所有条目的顺序都相同。
如果不仔细检查列表中的每个项目,似乎每个条目都有几个<div>
元素,但只有一个<div>
's 中有<p>
元素。并且没有一个<div>
's 有课程,这会使这很容易。
我尝试了几种不同的方法,因此似乎没有任何方法可以提取我想要的文本。我看过几个不同的例子,但没有一个真的与我正在寻找的足够接近。
如果这样的事情有效,那就太好了:
$bodyText = $tree->look_down( '_tag' => 'div' => 'p' );
但这给了我错误:
param list to look_down ends in a key!
无论如何,也许有人可以帮助我指出正确的方向,我一直在寻找整夜,现在我的脑痛。
谢谢!
约翰