0

我想修复一些关于 urlparse.urljoin 的情况。像这样使用这个库

urljoin('http://xxxx.yyy/directory/','file.file')

给我http://xxxx.yyy/directory/file.file但如果我最后没有在 url 中给出斜线

urljoin('http://xxxx.yyy/directory','file.file')

给了我http://xxxx.yyy/file.file这让我无法编写自动收集程序。任何人都可以解决这个问题。我试图用正则表达式最后加上斜线并替换,但是当 url 完成时这些不能正常工作

http://xxxx.yyy/zzzz/file.file
4

1 回答 1

0

它的行为正确。如果您打开http://example.com/index.html并单击指向 的链接two.html,您最终会到达http://example.com/two.html。这就是定义相对 URL 的工作方式。

urljoin无法知道最后一个组件是否是目录。您可以尝试猜测,也许通过寻找 a .,并且仅在您认为应该存在的情况下添加斜线。

于 2014-02-10T06:10:56.840 回答