我正在尝试使用WWW::Mechanize方法从 HTML 页面中提取一些链接find_all_links()
。它支持匹配这些条件:
- 文本
- text_regex
- 网址
- url_regex
- url_abs
- url_abs_regex
...
如何提取除具有文本“xyz”的链接之外的所有链接?
我正在尝试使用WWW::Mechanize方法从 HTML 页面中提取一些链接find_all_links()
。它支持匹配这些条件:
如何提取除具有文本“xyz”的链接之外的所有链接?
您可以使用以下'text_regex'
标准:
$mech->find_all_links(text_regex => qr/^(?!xyz$).*$/);
有关负前瞻断言的更多信息,请参见perldoc perlre。
为什么不获取所有链接,然后使用“grep”跳过不需要的链接?