我需要为自己整理一个小项目,并且需要一些功能来下载页面以供离线查看。是否有一个库可以下载给定页面及其嵌入的图像,并编辑 img 标签以反映图像的本地位置。
我知道那里有很多网站下载器,但我找不到可以直接在我的代码中使用的东西。
我有一些用 python 完成的基本脚本,所以 Python 非常受欢迎。但几乎任何语言都可以。
我需要为自己整理一个小项目,并且需要一些功能来下载页面以供离线查看。是否有一个库可以下载给定页面及其嵌入的图像,并编辑 img 标签以反映图像的本地位置。
我知道那里有很多网站下载器,但我找不到可以直接在我的代码中使用的东西。
我有一些用 python 完成的基本脚本,所以 Python 非常受欢迎。但几乎任何语言都可以。
您正在寻找BeautifulSoup。
python网络爬虫怎么样? http://code.google.com/p/pywebcrawler/
或者,海葵(红宝石)? http://anemone.rubyforge.org/
是的,BeautifulSoup + python urllib模块
我能想到的最简单的解决方案。
wget -p example.com