我一直在玩 HPricot,但经过大量搜索后,我无法解决这个问题。
我正在尝试解析 HTML 页面并找到所有带有 href 到 mp3 文件的标签。到目前为止我有
<ul>
<% @page.search('//a[@href*=mp3]').each do |link| %>
<li>
<%= link.inner_text %>
</li>
<% end %>
</ul>
哪个工作正常,一个正则表达式/href\s*=\s*\"([^\"]+)(.mp3)/
也可以。我只是不确定如何将两者结合起来。
是否有一个很好的例子,或者有人可以指出我的文档,以便弄清楚我可以用 .search 功能做什么。
谢谢