1

Google 网站管理员工具报告网站服务器上某些文件夹的 403 错误,例如:

http://www.philaletheians.co.uk/Study%20notes/

该文件夹未被禁止,所以不明白为什么 Googles Crawler 会出现 403 错误?

为什么 Google Crawler 会尝试浏览实际文件夹,而不是直接访问该文件夹中的文件?这与 robots.txt 有关系吗?

4

2 回答 2

2

如果有人请求该 url,请确保是否存在任何实际位置或文档。我浏览了您的网站,但找不到指向http://www.philaletheians.co.uk/Study%20notes/的链接, 而且似乎所有的学习笔记都在这个“Study%20notes”目录中。所以实际上这个链接无论如何都不起作用。所以检查谷歌网站管理员工具的链接,找到这个断开的链接所在的位置并修复它。

于 2012-10-03T10:51:39.733 回答
1

您是否在 Web 服务器中正确设置了默认文档?在 apache 中,这来自 DirectoryIndex 设置(默认为 index.html)。此外,通常最好从可遍历的目录名称中去掉空格等(您在 Study 和 notes 之间看到的 %20 是一个 url 编码的空格字符),以使您的 URL 对访问者保持干净和搜索引擎机器人。

于 2011-12-18T13:14:19.197 回答