这是python代码:
url = http://www.phonebook.com.pk/dynamic/search.aspx
path = urlparse(url)
print (path)
>>>ParseResult(scheme='http', netloc='www.phonebook.com.pk', path='/dynamic/search.aspx', params='', query='searchtype=cat&class_id=4520&page=1', fragment='')
print (path.path)
>>>/dynamic/search.aspx
现在我需要改变path.path
我的要求。就像如果“/dynamic/search.aspx”是路径,那么我只需要第一个斜杠和最后一个斜杠之间的部分,包括“/dynamic/”的斜杠。
我已经尝试了这两行,但最终结果不是我所期望的,这就是我问这个问题的原因,因为我对“urllib.parse”的了解不足。
path = path.path[:path.path.index("/")]
print (path)
>>>Returns nothing.
path = path.path[path.path.index("/"):]
>>>/dynamic/search.aspx (as it was before, no change.)
简而言之,无论 path.path 结果是我需要的只是目录名称。例如:“动态/搜索/搜索.aspx”。现在我需要“动态/搜索/”