我想改造2012年伦敦奥运会的奖牌,以更好地体现奖牌的价值。目前仅按金牌排序。我想按点重新列出它,所以黄金=4,白银=2,青铜=1,以创建一个新的更合理的列表。我可能想记住以前的排名,然后还要添加一个新的排名列。
我想尝试机械化以从站点获取原始数据,然后将数据解析为行和列,应用新计数,然后重新制作列表。
来自http://www.london2012.com/medals/medal-count/的来源,每个国家/地区都有一个带有奖牌的区块,如下所示:
<span class="countryName">Canada</span></a></div></div></td><td class="gold c">0</td><td class="silver c">2</td><td class="bronze c">5</td>
如果我使用 agent.get('http://www.london2012.com/medals/medal-count') 它会显示整个列表。如何解析特定的跨度和表数据?
我还需要记住排名,然后当我制作新页面时,将新排名放在它旁边。
任何有关机械化解析和记忆数据的技巧都会非常有帮助。更重要的是你在做这样的事情时的思考过程,我很感激能帮助我开始。这不一定是代码答案
谢谢