我有一个 html 文件,其中包含一些链接,例如
<a href="clash/football/a-vs-b">
<a href="clash/football/dsfdsfds-vs-erer">
我用这个$regex_pattern = "/^[^.]+((\.[^.\/]{1,3}\b){1,2}).*$/";
模式来查找这种类型的 URL。但不能得到这个。请有人帮助我。我需要匹配总标签"<a href="clash/football/a-vs-b">"
正则表达式描述对正则语言的操作,html
不是正则语言!使用DomDocument会更好。
然后,您可以查看getElementsByTagName
以获取所有<a href>
标签。