4

我们记录了对特定搜索词的大量搜索:-“biscru”或“Ticru”(过去 2 个月内 63,000 次)。apache 日志显示这些请求来自 Google 的服务器,但我发现这很难相信并怀疑 IP 地址被欺骗了。

Apache 日志示例:-

rawliving.eu:66.249.72.227 - - [06/Jul/2013:01:25:09 +0100]
"GET /catalogsearch/result/index/?cat=47&dir=desc&limit=25&mode=list&order=event_date&p=6
&q=%22biscru%22+OR+%22Ticru%22
HTTP/1.1" 200 20587 "-" "Mozilla/5.0 (compatible; Googlebot/2.1;
+http://www.google.com/bot.html)"

显然阻止 66.249.72.227 不是一个选项,因为它是一个有效的谷歌地址,所以任何人都可以建议我们必须采取哪些选项来防止这种失真,并可能确定这些请求来自哪里以及为什么?

感激地收到任何建议。李

4

1 回答 1

3

将此添加到您的 layout-xml 定义中,例如 local.xml

<catalogsearch_result_index translate="label">
        <reference name="head">
            <action method="setRobots"><value>NOINDEX,NOFOLLOW</value></action>
        </reference>
    </catalogsearch_result_index>
    <catalogsearch_advanced_index translate="label">
        <reference name="head">
            <action method="setRobots"><value>NOINDEX,NOFOLLOW</value></action>
        </reference>
    </catalogsearch_advanced_index>
    <catalogsearch_advanced_result translate="label">
        <reference name="head">
            <action method="setRobots"><value>NOINDEX,NOFOLLOW</value></action>
        </reference>
    </catalogsearch_advanced_result>

检查几天后问题是否仍然存在......或者只是使用 robots.txt 文件来阻止目录搜索 url 被编入索引。

于 2013-07-06T10:58:52.547 回答