python - 如何在字符串中找到多个 URL（href 属性）

Question

我编写了一个脚本（参见此处）来从模板目录中获取所有 URL，但是一些 href 包含两个要使用的 URL，具体取决于应用程序运行的语言。

所以我的脚本目前给了我一个列表中的任何内容href='here'，但现在我还想从一个看起来像这样的 href 收集 URL；

href="{{ 'http://www.link.com/blah/page.htm'|cy:'http://www.link.com/welsh/blah/page.htm' }}"

我需要什么正则表达式来返回这些？（和很多人一样，我在正则表达式方面很糟糕！）

score 2 · Accepted Answer

就像是：

href="{{ 'http://www.link.com/blah/page.htm'|cy:'http://www.link.com/welsh/blah/page.htm' }}"

import re
print re.findall("'(http://(?:.*?))'", href)
# ['http://www.link.com/blah/page.htm', 'http://www.link.com/welsh/blah/page.htm']

接受任何以 http:// 开头的撇号内的内容。

python - 如何在字符串中找到多个 URL（href 属性）

1 回答 1

Related

Reference