我正在编写一个基于html/javascript/PHP的Web 应用程序,它允许用户输入随机关键字并返回该关键字在 Google.com 上搜索时会产生的命中数
我知道这可以通过多种不同的方法来实现,但我想要的是最简单的方法。
如果我们选择允许 2% 的边际误差,您认为最好的方法是什么?你能展示一些示例代码吗?
方法一:屏幕抓取
使用 PHP 并file_get_contents
像这样
$keyword = "Football";
$html = file_get_contents("http://www.google.com/?q=" . rawurlencode($keyword));
preg_match('/Results: - \d+ of about ([0-9,]+) for/', $html, $reg);
var_dump($reg[1]);
但这对我来说并不完全,我想这会违反谷歌的使用条款?那会有什么影响?
方法 2:谷歌 Ajax API
使用 Google Ajax API 和estimatedResultsCount
JSON 中的属性。我真的不知道如何实际执行此操作,因此如果您认为这将是更好的方法,您能否提供一些示例代码,以便我理解?
其他方法?我在这里真正要寻找的是关于使用什么技术以及如何使用它们的具体、更精确的答案。同样,为了清楚起见,还请提供一些示例代码。