1

我需要为自己整理一个小项目,并且需要一些功能来下载页面以供离线查看。是否有一个库可以下载给定页面及其嵌入的图像,并编辑 img 标签以反映图像的本地位置。

我知道那里有很多网站下载器,但我找不到可以直接在我的代码中使用的东西。

我有一些用 python 完成的基本脚本,所以 Python 非常受欢迎。但几乎任何语言都可以。

4

4 回答 4

1

您正在寻找BeautifulSoup

于 2010-03-15T14:54:43.397 回答
1

python网络爬虫怎么样? http://code.google.com/p/pywebcrawler/

或者,海葵(红宝石)? http://anemone.rubyforge.org/

于 2010-03-15T14:59:58.990 回答
1

是的,BeautifulSoup + python urllib模块

于 2010-03-15T15:08:29.547 回答
0

我能想到的最简单的解决方案。

wget -p example.com
于 2011-12-01T04:03:00.753 回答