我目前正在构建一个基于 watin 的小应用程序,它登录到一个网站,然后开始通过一系列 URL 来使用 Watin 下载 PDF 文件。
该网站使用大量 javascript 来加载嵌入 HTML 中的 pdf。
该程序目前运行良好,但速度很慢,因为 watin 不能非常有效地处理下载(它使用 Firefox 下载系统并在保存前缓慢键入文件名。
我想知道是否有更好的 Web Scraping 框架可以为 Ajax 站点提供相同的支持,但更好/更快地下载文件。
我在网上到处都发现了 selenium,但它在文件下载方面并不比 watin 更有效。
在此先感谢您的帮助。