1
...
<div class="termContainer">
<h4>SUMMER 2013</h4>
<ul>
<li>   
<a href="url" title="A">
<span>A</span>
</a></li>
<li><a href="url" title="B">
<span>B</span>
</a></li>
<li><a href="url" title="C">
<span>C</span>
</a></li>
</ul>
</div>
...
<div class="termContainer">
<h4>SPRING 2013</h4>
...other links
</div>
...

我正在编写一个 perl 脚本来获取里面的链接标题

<div class="termContainer"> 

在上面的 HTML 代码中。我的预期结果是 A、B、C。

我真的不知道如何处理它。有什么建议吗?

非常感谢。

4

1 回答 1

4
use HTML::TreeBuilder::XPath;

my $html = <<EOFHTML;
...
<div class="termContainer">
<h4>SUMMER 2013</h4>
<ul>
<li>   
<a href="url" title="A">
<span>A</span>
</a></li>
<li><a href="url" title="B">
<span>B</span>
</a></li>
<li><a href="url" title="C">
<span>C</span>
</a></li>
</ul>
</div>
...
<div class="termContainer">
<h4>SPRING 2013</h4>
...other links
</div>
...
EOFHTML

my $tree = HTML::TreeBuilder::XPath->new_from_content($html);

foreach my $title ( $tree->findvalues('//div[@class="termContainer"]//a/@title') ) {
    print $title, "\n";
}
于 2013-10-04T05:25:25.083 回答