我想在 ruby 中开发一个“页面下载器”——给定一个 url,它会下载 html、相关的 css、图像文件和 javascript,然后更改 html 以引用本地副本而不是远程副本。就像某些浏览器使用“另存为完整页面”选项一样。
我正在考虑使用 Nokogiri 进行页面的初始解析。但我不确定它是否是这项工作的最佳工具:
- 它可以获取外部依赖项(样式表、图像和 javascript)的列表吗?我不关心 javascript 生成的依赖项。
- 它会解析 CSS 吗?我可能也想下载图像或@imported css 文件。
是否有一颗宝石已经可以满足我的要求?