我正在写一些东西来“清理”一个 URL。在这种情况下,我要做的就是返回一个伪造的方案,因为urlopen
没有它就行不通。但是,如果我用它测试www.python.org
它会返回http:///www.python.org
。有谁知道为什么会有额外的 /,有没有办法在没有它的情况下返回它?
def FixScheme(website):
from urlparse import urlparse, urlunparse
scheme, netloc, path, params, query, fragment = urlparse(website)
if scheme == '':
return urlunparse(('http', netloc, path, params, query, fragment))
else:
return website