3

我正在尝试使用WWW::Mechanize方法从 HTML 页面中提取一些链接find_all_links()。它支持匹配这些条件:

  • 文本
  • text_regex
  • 网址
  • url_regex
  • url_abs
  • url_abs_regex
    ...

如何提取具有文本“xyz”的链接之外的所有链接?

4

2 回答 2

6

您可以使用以下'text_regex'标准:

$mech->find_all_links(text_regex => qr/^(?!xyz$).*$/);

有关负前瞻断言的更多信息,请参见perldoc perlre

于 2010-03-26T12:31:40.207 回答
1

为什么不获取所有链接,然后使用“grep”跳过不需要的链接?

于 2010-03-26T13:50:48.103 回答