urllib.parse.urljoin(base, url )
如果 url 是绝对 URL(即,以 //、http://、https://、...开头),则 url 的主机名和/或方案将出现在结果中。例如:
>>> urljoin('https://www.google.com', '//www.microsoft.com')
'https://www.microsoft.com'
>>>
否则,urllib.parse。urljoin (base, url) 将
通过将“基本 URL”(base)与另一个 URL(url)组合来构造一个完整(“绝对”)的 URL。非正式地,这使用基本 URL 的组件,特别是寻址方案、网络位置和(部分)路径,以提供相对 URL 中缺少的组件。
>>> urlparse('http://a/b/c/d/e')
ParseResult(scheme='http', netloc='a', path='/b/c/d/e', params='', query='', fragment='')
>>> urljoin('http://a/b/c/d/e', 'f')
>>>'http://a/b/c/d/f'
>>> urlparse('http://a/b/c/d/e/')
ParseResult(scheme='http', netloc='a', path='/b/c/d/e/', params='', query='', fragment='')
>>> urljoin('http://a/b/c/d/e/', 'f')
'http://a/b/c/d/e/f'
>>>
它获取第一个参数(base)的路径,剥离最后一个 / 之后的部分并与第二个参数(url)连接。
如果url以/开头,则用url加入base的scheme和netloc
>>>urljoin('http://a/b/c/d/e', '/f')
'http://a/f'