我刚刚开始在 Python 中使用 Scraperwiki 进行抓取。已经想出了如何从页面中抓取表格,每月运行抓取器并将结果彼此重叠保存。很酷。
现在我想用有关 Android 版本的信息抓取此页面并每月运行脚本。特别是,我想要版本、代号、API 和分发的表格。这并不容易。
使用包装器 div 调用该表。有什么办法可以抓取这些信息吗?我找不到任何解决方案。
计划 B 是对可视化进行刮擦。我最终需要的是代号和百分比,这样就足够了。可以在 Google Chart 脚本的 HTML 中找到此信息。
但我无法用我的“souped”HTML 找到这些信息。我这里有一个公共刮刀。您可以对其进行编辑以使其正常工作。
谁能解释我如何解决这个问题?一个对正在发生的事情发表评论的工作刮板会很棒。