http-status-code-403 - 网站管理员工具爬虫 403 错误

Question

Google 网站管理员工具报告网站服务器上某些文件夹的 403 错误，例如：

http://www.philaletheians.co.uk/Study%20notes/

该文件夹未被禁止，所以不明白为什么 Googles Crawler 会出现 403 错误？

为什么 Google Crawler 会尝试浏览实际文件夹，而不是直接访问该文件夹中的文件？这与 robots.txt 有关系吗？

score 2 · Accepted Answer

如果有人请求该 url，请确保是否存在任何实际位置或文档。我浏览了您的网站，但找不到指向http://www.philaletheians.co.uk/Study%20notes/的链接，而且似乎所有的学习笔记都在这个“Study%20notes”目录中。所以实际上这个链接无论如何都不起作用。所以检查谷歌网站管理员工具的链接，找到这个断开的链接所在的位置并修复它。

score 1 · Accepted Answer

您是否在 Web 服务器中正确设置了默认文档？在 apache 中，这来自 DirectoryIndex 设置（默认为 index.html）。此外，通常最好从可遍历的目录名称中去掉空格等（您在 Study 和 notes 之间看到的 %20 是一个 url 编码的空格字符），以使您的 URL 对访问者保持干净和搜索引擎机器人。

http-status-code-403 - 网站管理员工具爬虫 403 错误

2 回答 2

Related

Reference