0

我编写了一个脚本(参见此处)来从模板目录中获取所有 URL,但是一些 href 包含两个要使用的 URL,具体取决于应用程序运行的语言。

所以我的脚本目前给了我一个列表中的任何内容href='here',但现在我还想从一个看起来像这样的 href 收集 URL;

href="{{ 'http://www.link.com/blah/page.htm'|cy:'http://www.link.com/welsh/blah/page.htm' }}"

我需要什么正则表达式来返回这些?(和很多人一样,我在正则表达式方面很糟糕!)

4

1 回答 1

2

就像是:

href="{{ 'http://www.link.com/blah/page.htm'|cy:'http://www.link.com/welsh/blah/page.htm' }}"

import re
print re.findall("'(http://(?:.*?))'", href)
# ['http://www.link.com/blah/page.htm', 'http://www.link.com/welsh/blah/page.htm']

接受任何以 http:// 开头的撇号内的内容。

于 2013-07-11T08:40:57.323 回答