0

在过去的几个月里,googleBot 一直在访问我的网站 [index.php] 上不再存在的文件,因为所有以正确语言到正确主页的路由都是通过 htaccess 中的 apache 重写规则处理的。

Ans to,我注释掉了我的 .htaccessDirectoryIndex index.php 规则

RewriteEngine on
RewriteBase /
Options +FollowSymLinks -Indexes -ExecCGI
# DirectoryIndex index.php    (not needed anymore, index.php doesnt exist)
# DirectoryIndex /en/home     (should it be set to this now??)

目前,一切都很好:http://website.org根目录立即重定向到/en/home通过 301 永久重定向!

66.249.67.142 / == crawl-66-249-67-142.googlebot.com 一次又一次地访问我的网站,试图读取不存在的 index.php。我该怎么办??

潜入带有此类条目的无尽错误日志文件(可怜的 googlebot 我认为它可能更智能......)

[Fri Mar 04 20:48:30 2011] [error] [client 66.249.66.177] File does not exist: 
/var/www/vhosts/site.com/httpdocs/index.php

[Fri Mar 04 20:58:59 2011] [error] [client 66.249.66.177] File does not exist: 
/var/www/vhosts/site.com/httpdocs/index.php

[Fri Mar 04 21:00:18 2011] [error] [client 66.249.67.142] File does not exist: 
/var/www/vhosts/site.com/httpdocs/index.php

[Fri Mar 04 21:01:05 2011] [error] [client 66.249.66.177] File does not exist: 
/var/www/vhosts/site.com/httpdocs/index.php

[Fri Mar 04 21:12:28 2011] [error] [client 66.249.66.164] File does not exist: 
/var/www/vhosts/site.com/httpdocs/index.php

[Fri Mar 04 21:27:30 2011] [error] [client 66.249.68.115] File does not exist: 
/var/www/vhosts/site.com/httpdocs/index.php 
4

2 回答 2

1

有人链接到 index.php,所以 Google 正试图追随它。

从 index.php 重写到 /en/home,你会很成功。

E:另外,DirectoryIndex不能是路径,AFAIK。如果没有另外指定,它只是告诉服务器应该提供目录中的哪个文件。

于 2011-03-05T01:30:16.017 回答
1

/就通过 HTTP 访问您的站点的任何内容而言,/index.php它们都是单独的资源。仅仅因为您正在重定向/,如果 Google 之前看到过链接,这并不意味着什么/index.php

只需以与重定向相同的方式重定向/index.php到./en/home/

于 2011-03-05T01:31:18.430 回答