2

我正在尝试使用 Mechanize link_with(:href => 'anchor here') 来查找在 href 中包含带有特定字符串的链接的页面。例如,我想要它,以便我可以将所有具有锚点包含“index.php?user”的链接的站点吐到一个文本文件中

我该怎么办?

4

3 回答 3

5

感谢大家的回答,我最终选择了 page.link_with(:href => /(.*)?user$/)

于 2012-05-09T19:48:21.330 回答
1
urls = ['http://www.google.com/','http://www.foo.com/','http://www.bar.com/']

File.open('output.txt', 'w') do |out|
  urls.each do |url|
    out << url if agent.get(url).link_with(:href => /index.php\?user/)
  end
end
于 2012-05-09T09:21:03.773 回答
0

我建议您查看 XPath 选择器:

jQuery Xpath 选择器选择 id 包含“sometext”的元素

可以在此处找到有关如何将 XPath 与 mechanize 一起使用的示例:

使用 Ruby/Mechanize(和 Nokogiri)从 HTML 中提取单个字符串

于 2012-05-09T08:22:30.550 回答