0

我正在使用HTML::TreeBuilder以从 html 文件中提取数据。我需要做的是:

$div->look_down(_tag => 'a', 'href' !=> 'index.html')

所以我正在寻找一个不等于 'index.html' 和另一个标签的 href,但显然!=>不是HTML::TreeBuilder. 我怎样才能实现这样的目标?我可以使用正则表达式吗?

BR

4

1 回答 1

2

没有“不等于”,但您可以使用匹配除该字符串之外的任何内容的正则表达式,如下所示

$div->look_down( _tag => 'a', href => qr/\A(?!index\.html\z)/i )

或者您可以编写一个进行检查的子程序

$div->look_down( _tag => 'a', sub { lc $_[0]->attr('href') ne 'index.html' } )
于 2014-09-13T15:30:09.257 回答