我有问题。我在谷歌中编写了一个搜索网站位置的程序。它是这样工作的:
从 url 字符串进行搜索。然后解析html页面的结果并找到站点位置。但我找不到在哪里处理区域参数。可能它在 url 字符串参数中。必须将内部 cookie 发送到服务器的可能。可能还有更多。我用于搜索 google.ru 网站。
我有问题。我在谷歌中编写了一个搜索网站位置的程序。它是这样工作的:
从 url 字符串进行搜索。然后解析html页面的结果并找到站点位置。但我找不到在哪里处理区域参数。可能它在 url 字符串参数中。必须将内部 cookie 发送到服务器的可能。可能还有更多。我用于搜索 google.ru 网站。
“查找在特定地区发布的页面”的查询字符串参数是 cr,该参数的可能值似乎是字符串“country”,后跟2 个字母的 ISO 国家代码。例如,要搜索在美国发布的页面,请添加&cr=countryUS
到您的查询字符串;要搜索在俄罗斯发布的页面,请添加&cr=countryRU
到您的查询字符串。
如需更多探索,请尝试使用 Google高级搜索页面或高级搜索(俄语) ——输入一些搜索参数——并观察浏览器的地址栏以查看为您构建的 URL(及其查询字符串)。
发布脚本
您可能会发现有用的其他查询字符串参数是
&lr=lang_ru
&as_sitesearch=.ru
更多关于 &cr 参数
尽管该参数被标记为“地区”,但它仅限于搜索源自特定国家/地区的页面。它不能用于搜索来自特定地区、州、省或俄罗斯等国家/地区的各种细分的页面。我怀疑谷歌使用“地区”这个词是为了避免一个地方的地位存在争议的政治分歧。有关更多信息,请参阅Google 的 XML API文档(文档说它仅适用于 Google Site Search 客户,但我认为它适用于您的情况)。