我无法从 Google 结果中抓取网址。这段代码为我工作了很长时间,但似乎谷歌本周改变了一些东西,现在我得到了大量的额外字符,被我想要的实际 URL 包围。
preg_match_all('@<h3\s*class="r">\s*<a[^<>]*href="([^<>]*)"[^<>]*>(.*)</a>\s*</h3>@siU', $results, $matches[$key]);
编辑
用上面的代码刮掉所有的链接都是这样的
/url?url=http://cooksandtravelbooks.com/write-for-us/&rct=j&sa=U&ei=XdayUNnHBIqDiwKZuYEY&ved=0CBQQFjAA&q=cooking+%5C%22Write+for+Us%5C%22&usg=AFQjCNGMiCiWYY_8JDAhqJggVDW2qHRMfw