1

我写了一个python代码:

import re

url = "www.google.com";
line = "../../asyouwish.html"

num = re.sub(r'(\.\.\/)*', url, line)
print ("Final : ", num)

我的意图是用提供的 url 值替换 ../ (任意次数)。但是我没有得到正确的输出。我想要的输出是“www.google.com/asyouwish.html”。

我得到的是:

Final :  www.google.comawww.google.comswww.google.comywww.google.comowww.google.
comuwww.google.comwwww.google.comiwww.google.comswww.google.comhwww.google.com.w
ww.google.comhwww.google.comtwww.google.commwww.google.comlwww.google.com

谁能帮我看看我哪里出错了!!!谢谢。

4

2 回答 2

5

*表示 0 次或多次出现。+表示 1 个或多个。您希望匹配至少出现 1 次../. 所以更改*+

import re

url = "www.google.com/"
line = "../../asyouwish.html"

num = re.sub(r'([.]{2}/)+', url, line)
print ("Final : ", num)

产量

('Final : ', 'www.google.com/asyouwish.html')

由于re.sub将删除 1-or-more '../',因此您需要在url. 在上面,我已将正斜杠添加到url自身。如果url没有正斜杠,您可以(作为替代)添加它

num = re.sub(r'([.]{2}/)+', url+'/', line)

当您匹配 0 次或多次出现时,中的字符之间r'([.]{2}/)*'的每个位置都与模式匹配,因此您会在每个空隙处获得替换。line

In [9]: x = 'www.google.comawww.google.comswww.google.comywww.google.comowww.google.comuwww.google.comwwww.google.comiwww.google.comswww.google.comhwww.google.com.www.google.comhwww.google.comtwww.google.commwww.google.comlwww.google.com'

In [13]: x.split('www.google.com')
Out[13]: ['', 'a', 's', 'y', 'o', 'u', 'w', 'i', 's', 'h', '.', 'h', 't', 'm', 'l', '']
于 2013-04-11T12:26:26.377 回答
0

使用类似的东西

url = "www.google.com";
line = "../../asyouwish.html"
link_part = line.split("/")

final_url = url + "/" + link_part[-1]
于 2013-04-11T12:24:52.953 回答