今天我在我的网络主机上偶然发现了一个名为“error.log”的文件夹。我想我会看看。
我看到多个“文件不存在”错误 - 条目分为三种类型:
- 机器人.txt
- 缺少.html
- 苹果触摸图标precomposed.png
我对这些文件的用途有一些猜测,但想明确知道:
- 有问题的文件是什么?
- 我应该将它们添加到我的服务器吗?
- 什么提示要为这些写入错误日志?是有人明确要求他们吗?如果是这样,谁以及如何?
今天我在我的网络主机上偶然发现了一个名为“error.log”的文件夹。我想我会看看。
我看到多个“文件不存在”错误 - 条目分为三种类型:
我对这些文件的用途有一些猜测,但想明确知道:
网络robots.txt
爬虫/机器人读取文件以允许/禁止它在您的服务器上抓取资源。然而,机器人读取这个文件不是强制性的,但是好的机器人可以。在http://en.wikipedia.org/wiki/Robots.txt有一些进一步的示例示例文件可能看起来像并且将驻留在 Web 根目录中:
User-agent: * # All robots
Disallow: / # Do not enter website
或者
User-Agent: googlebot # For this robot
Disallow: /something # do not enter
apple-touch-icon-precomposed.png
解释https://stackoverflow.com/a/12683605/722238 _
我相信missing.html
某些人将其用作定制的 404 页面。机器人可能被配置为抓取此文件,因此请求它。
如果你想控制机器人从你的服务器上刮下的资源,你应该添加一个 robots.txt 文件。如前所述,机器人读取此文件不是强制性的。
但是,如果您想添加其他两个文件以删除错误消息,那么我认为没有必要。没有什么可以说 joe_random 不会在您的服务器上发出请求,/somerandomfile.txt
在这种情况下,您将收到另一个不存在的另一个文件的错误消息。然后,您可以将它们重定向到自定义的 404 页面。