我编写了一个简单的 Python 脚本来下载网页以供离线查看。问题是相关链接被破坏了。所以离线文件“c:\temp\webpage.html”有一个 href="index.aspx" 但是当在浏览器中打开时它解析为“file:///C:/temp/index.aspx”而不是“ http://myorginalwebsite.com/index.aspx ”。
所以我想我必须修改我的脚本来修复每个相关链接,使其指向原始网站。有没有更简单的方法?如果没有,任何人都有一些示例 Python 代码可以做到这一点?我是 Python 新手,所以任何指针都将不胜感激。
谢谢。