我正在尝试实现一个图像抓取功能,该功能类似于 Facebook 在您发布链接时所做的工作。我不关心实际的 UI 部分。我只想将 URL 传递给脚本并让它返回页面上所有图像的 URL。
将只在某些时候有效的东西放在一起真的很容易——例如this ——但我想要一些效果相当好的东西。
我有能力自己写这种东西,但如果已经有免费的东西写出来,我这样做当然是愚蠢的。
有谁知道存在这样的工具吗?我不在乎它使用什么语言,只要它能在 *nix 上运行。
我正在尝试实现一个图像抓取功能,该功能类似于 Facebook 在您发布链接时所做的工作。我不关心实际的 UI 部分。我只想将 URL 传递给脚本并让它返回页面上所有图像的 URL。
将只在某些时候有效的东西放在一起真的很容易——例如this ——但我想要一些效果相当好的东西。
我有能力自己写这种东西,但如果已经有免费的东西写出来,我这样做当然是愚蠢的。
有谁知道存在这样的工具吗?我不在乎它使用什么语言,只要它能在 *nix 上运行。
你可以从 python 和 Scrapy http://doc.scrapy.org/en/latest/index.html开始