我正在尝试使用 mechanize 解析网站的内容,但我陷入了困境。我要解析的内容位于li
标签内,并且顺序并不总是相同。
让我们假设我们有以下li
标签的顺序并不总是相同的,有时甚至可能根本不存在。
<div class="details">
<ul>
<li><span>title 1</span> ": here are the details"</li>
<li><span>title 2</span> ": here are the details"</li>
<li><span>title 3</span> ": here are the details"</li>
<li><span>title 4</span> ": here are the details"</li>
</ul>
</div>
我想要的是仅获取文本li
所在的详细信息。我所做的是以下内容,它为我提供了第一个细节:span
title 3
li
puts page.at('.details').at('span', :text => "title 3").at("+ *").text
有没有办法使用 mechanize 做我想做的事,还是我也应该使用其他方法?