0

我想根据他们的网址抓取一些网页。据称 Geb 库能够进行屏幕抓取。

到目前为止,我得到的是使用 Browser.drive 方法并在该方法中指定一个页面 url。这样我就能够从该特定页面抓取数据。但每次我必须手动将 url 更改为另一个页面。当我再次运行脚本时,将打开一个新的浏览器,这需要相当长的时间。我不需要打开浏览器,只需要从页面中抓取数据。我相信必须有某种机制让我以批处理模式对我的所有网页进行数据抓取。我已经阅读了The Book Of Geb好几遍,但仍然找不到任何关于如何做到这一点的讨论。

4

0 回答 0