我正在尝试使用正则表达式从 html 代码中获取 url。我对正则表达式了解不多,所以我有点困惑,因为它不起作用。情况是这样的:
<a href="cotizacion-valor/abengoa/" style="text-decoration:none;color:#006699;">ABG.MC</a>
我正在尝试使用这个正则表达式来获得“abengoa”:
".*cotizacion-valor\/(/w+)\/.*"
另外,我正在使用python,所以代码是:
regex_companies = ".*cotizacion-valor\/(/w+)\/.*"
match_companies = re.findall(regex_companies, content_web)
我的正则表达式有什么问题?谢谢
编辑:还有一个问题:
我该怎么做才能只获得第一场比赛?因为这个href是在文档中重复的,内容相同(但也不同,所以我必须全部搜索)。