问题标签 [robots.txt]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

1372 问题

0 投票

2 回答

190 浏览

web-crawler - 如何“合并”页面“\Default.aspx”和“\”？

我们的网站是用 ASP.NET 开发的。我们想要阻止来自 Google 和其他搜索引擎的 Default.aspx 页面。我们如何“关闭” Default.aspx 页面使其无法访问？或者有没有另一种方法来解决这个问题，这样我们就不会创建重复的内容。

web-crawler robots.txt

2010-03-24T17:51:40.043

0 投票

5 回答

51046 浏览

sitemap - 多个站点地图：robots.txt 中的条目？

我一直在使用谷歌搜索，但我找不到这个问题的答案。

robots.txt 文件可以包含以下行：

但是是否可以在 robots.txt 中指定多个站点地图索引文件并让搜索引擎识别并抓取每个站点地图索引文件中引用的所有站点地图？例如，这是否有效：

sitemap robots.txt

2010-04-07T16:31:58.727

0 投票

2 回答

543 浏览

asp.net - 允许搜索引擎抓取用户名

我有一个网站，用户可以在其中输入他们的个人资料并用密码保护某些详细信息。我希望搜索引擎抓取配置文件的“未受保护”部分（因用户而异）。类似于在 facebook 中输入用户的姓名，他们的 Facebook 个人资料会出现在搜索结果中。我是否需要做任何特别的事情来确保机器人不会爬取受密码保护的部分，但仍会爬取（始终公开的）用户名？我不确定这是否是一个问题，但我想更新我的 robots.txt 以允许这样做。

另外，我如何确保机器人可以使用用户名（以安全的方式）？我是否必须使用名称列表创建一个单独的目录，还是有更好的方法？

感谢您的任何建议

asp.net passwords bots robots.txt

2010-04-28T17:50:28.197

0 投票

1 回答

708 浏览

.htaccess - Htaccess/robots.txt 允许搜索机器人探索主域而不是其他域上的目录

好的，我知道标题没有任何意义，所以在这里我试图详细解释它。

我正在使用一个主机，它为我的域提供空间，并让我在其上“添加”其他域。所以假设我有一个域 A，我添加了一个域 B。基本上，我的主机给了我一个 public_html，我可以在其中放置显示有人访问网站 A 的内容。但是，当我添加域 B 时，它可以让我放置B 的内容，在那个 public_html 的 INSIDE 中，这样网站 B.com 也可以通过访问 A.com/siteB 来访问......这一切都很好，除了谷歌已经开始索引 B.com 以及 A.com/ siteB，我对它索引 B.com 没问题，但我想阻止它索引 A.com/siteB，这样当人们搜索 B 时，它最终不会显示 A.com/siteB。

有任何想法吗？如果问题仍然不清楚，请告诉我。

.htaccess hosting bots robots.txt

2010-05-09T14:19:41.090

0 投票

3 回答

22848 浏览