1

我创建了一个基于couchdb的 Web 应用程序。它托管在cloudant.com上(谢谢大家,来自 cloduant 的你们太棒了!)。

该应用程序的名称是RIDE::Research Infrastructure Database for EPOS

我的问题是,在搜索它时,如果您插入关键字“epos Ride”,那么第一个结果就是设计文档……这对于我搜索网络应用程序的客户来说绝对不合适!

只要我理解它,就不可能:

  1. read_protect 设计文档(它们包含用户必须可以访问的基本信息,请参阅。http://guide.couchdb.org/draft/design.html
  2. 创建从该页面到真正的索引页面的“重定向”(它只有一个“/index.html”附录),因为这个想法正是通过这个 RESTful API 获得设计文档。

所以我认为唯一的办法就是防止google索引设计文档。这在某种程度上可能吗?有没有其他解决方案可以解决这个问题?

4

1 回答 1

1

您可以告诉 Google 和其他搜索引擎,您不希望将您的网络存在的哪些部分编入索引。

只需将文件robots.txt放在您的公共可访问网站的根目录中,所有机器人都可以在http://www.example.com/robots.txt找到它,其中 www.example.com 是您的域地址。

这是一个简单的文本文件,您可以在下面找到如何使用该文件向网络机器人发出命令的示例。

http://en.wikipedia.org/wiki/Robots_exclusion_standard说:

该标准规定了用于通知机器人网站的哪些区域不应被处理或扫描的指令格式

此示例告诉所有机器人它们可以访问所有文件,因为通配符 * 指定了所有机器人:

User-agent: *
Disallow:

这个例子告诉所有机器人远离一个特定的文件:

User-agent: *
Disallow: /directory/file.html

这个例子告诉所有机器人不要进入三个目录:

User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /junk/
于 2015-03-13T17:55:40.003 回答