我安装了 Ruby 和 Mechanize。在我看来,在 Nokogiri 可以做我想做的事,但我不知道该怎么做。
这个table
呢?它只是 vBulletin 论坛站点的 HTML 的一部分。我试图保留 HTML 结构,但删除了一些文本和标签属性。我想获取每个线程的一些详细信息,例如:标题、作者、日期、时间、回复和视图。
请注意,HTML 文档中的表格很少?我在一张带有tbody
,的特定桌子之后<tbody id="threadbits_forum_251">
。名称将始终相同(我希望)。我可以在代码中使用tbody
和吗?name
<table >
<tbody>
<tr> <!-- table header --> </tr>
</tbody>
<!-- show threads -->
<tbody id="threadbits_forum_251">
<tr>
<td></td>
<td></td>
<td>
<div>
<a href="showthread.php?t=230708" >Vb4 Gold Released</a>
</div>
<div>
<span><a>Paul M</a></span>
</div>
</td>
<td>
06 Jan 2010 <span class="time">23:35</span><br />
by <a href="member.php?find=lastposter&t=230708">shane943</a>
</div>
</td>
<td><a href="#">24</a></td>
<td>1,320</td>
</tr>
</tbody>
</table>