我正在制作一个解析 html 并从中获取图像的应用程序。使用 Beautiful Soup 和下载 html 很容易解析,并且图像也适用于 urllib2。
我确实对 urlparse 有问题,无法从相对路径中创建绝对路径。这个问题最好用一个例子来解释:
>>> import urlparse
>>> urlparse.urljoin("http://www.example.com/", "../test.png")
'http://www.example.com/../test.png'
如您所见, urlparse 并没有带走 ../ 。当我尝试下载图像时,这会出现问题:
HTTPError: HTTP Error 400: Bad Request
有没有办法在 urllib 中解决这个问题?