2

我目前正在使用不允许索引我的 WP 管理员的 robots.txt 文件。目前我的机器人文件如下所示:

User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php

我希望搜索引擎也停止索引我的图像。这些是我的私人投资组合图像,我不希望它们出现在任何在线搜索中。

因此,我将为 Google Image bot 和 Bing bot 添加限制。我的 Robots.txt 文件现在看起来像这样:

User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php

User-agent: Googlebot-Image
Disallow: /

User-agent: msnbot-media
Disallow: /

这写对了吗?还有其他建议吗?我应该包括其他任何图像机器人吗?

4

1 回答 1

2

您当前的布局是正确的,但是有一种包罗万象的方法可以阻止机器人抓取您的图像。

看到您使用的是 WordPress,我将假设您使用的是正常的文件上传结构,这意味着您还可以在 robots.txt 中添加以下内容:

User-agent: *
Disallow: /wp-content/uploads/

我建议您将其与您当前拥有的内容结合使用,因为它只会阻止位于您上传文件夹中的图像。这不适用于直接在您的主题文件或插件内容等中的图像。

您的完整列表如下所示:

User-agent: *
Disallow: /wp-admin/
Disallow: /wp-content/uploads/
Allow: /wp-admin/admin-ajax.php

User-agent: Googlebot-Image
Disallow: /

User-agent: msnbot-media
Disallow: /

这条路线起初可能看起来很原始,但请记住,那里有数百个爬虫。为他们每个人创建一个规则可能会引起相当严重的头痛。

通过阻止 99.9% 的图像所在的位置,您无需列出您可以找到的每个爬虫,并且您还可以确保任何的爬虫在遵守您的 robots.txt 文件时立即添加到列表中.

在这一点上,还值得一提的是,有相当多的网络爬虫完全忽略了您的 robots 文件。

于 2017-07-13T05:51:54.603 回答