我有一个非常简单的 web 应用程序,它在 HTML5 的 Canvas 中运行,没有任何需要由搜索引擎索引的公共文件(除了包含对所有必要资源的调用的首页 HTML 文件之外)。因此,我真的不需要robots.txt
文件,因为他们只会看到公共文件,仅此而已。
现在,开个玩笑,每当网络爬虫请求robots.txt
. 但是,如果这最终会让我在搜索结果中的位置方面搞砸了,那么这对我来说不是一个非常值得的玩笑。
有人知道不同的网络爬虫如何响应非标准(尽管在这种情况下它在技术上是标准的)HTTP 代码吗?
此外,更严肃地说,是否有任何理由拥有一个robots.txt
文件,上面写着“一切都是可索引的!” 而不是没有文件?