我正在使用脚本来检查给定页面上的链接。我正在使用简单的 html DOM 将信息解析为数组。我必须检查所有 a 标签的 href 以查找它们是否包含文件或 # 或 JS 之类的东西。
我尝试了以下但没有成功。
if(preg_match("|^(.*)|iU", $href)){
save_link();
}
我不知道我的模式是错误的,或者是否有更好的方法来完成这个功能。
我希望能够检测 $href 是否包含 .com .php .file 扩展名。这样,它将过滤掉像 # "function()" 和 href 属性中使用的其他项目。
编辑: parse_url 将不起作用停止发布它。值 # 作为有效 url 返回,就像我在上面所说的那样,我正在尝试查找任何后跟 .* 且 .