这个问题已被多次询问,但我没有找到满足我需求的有效解决方案。
我创建了一个函数来检查 Google Ajax API 输出中的 URL: https ://ajax.googleapis.com/ajax/services/search/web?v=1.0&q=site%3Awww.bierdopje.com %2Fusers%2F+%22Gebruikersprofiel+van+%22+Stevo
我想从输出中排除“配置文件”这个词。因此,如果字符串包含该单词,则跳过整个字符串。
这是我到目前为止创建的功能:
function getUrls($data)
{
$regex = '/https?\:\/\/www.bierdopje.com[^\" ]+/i';
preg_match_all($regex, $data, $matches);
return ($matches[0]);
}
$urls = getUrls($data);
$filteredurls = array_unique($urls);
我创建了一个示例来明确我的意思:
http ://rubular.com/r/1U9YfxdQoU
在示例中,您可以看到选择了 4 个字符串,我只需要上面的 2 个字符串。我怎样才能做到这一点?