0

我在 WordPress 中建立了一个网站,并仅为会员设置了用户登录。因此,任何拥有该用户名和密码的人都可以在登录后查看该页面。其他人只需继续查看该站点即可。所以我得到了这个工作,除了客户之外,所有的人都输入了诸如 PDF 之类的信息,供用户在该页面上查看,并且这个客户正在网络上搜索 PDF 包含的名称,并且它不应该被公众访问,但仅限于那些谁已登录。有什么方法可以将 PDF 设置为私密的,搜索引擎不会搜索到该 PDF。如果我可以将其设置为不仅没有链接的人可以查看它,只有那些登录的人可以查看它。

4

3 回答 3

2

解决方案 1:密码保护

使用 HTTP 基本身份验证保护站点是阻止其他任何人访问该站点的最佳方法。但是,当您进行演示观众测试时,这并不总是可能的。

解决方案 2:Robots.txt

谷歌提供的另一个解决方案是使用 Robots.txt 文件告诉机器人不要抓取或列出结果中的页面。但这并不总是一个解决方案。Google 的 Matt Cuts 已确认,如果 Google 认为相关,Google 可能会包含来自此类网站的页面。

User-agent: *
Disallow: /

添加您的文件名以禁止

解决方案 3:使用 .htaccess RewriteCond

所以解决方案是阻止谷歌和其他类似的机器人访问你的网站。为此,请将以下代码放入您的 htaccess.xml 中。

RewriteEngine on
RewriteCond %{HTTP_USER_AGENT} AltaVista [OR]
RewriteCond %{HTTP_USER_AGENT} Googlebot [OR]
RewriteCond %{HTTP_USER_AGENT} msnbot [OR]
RewriteCond %{HTTP_USER_AGENT} Slurp
RewriteRule ^.*$ "http\:\/\/htmlremix\.com" [R=301,L]

将最后一行中的 URL 更改为您的主站点,以便在有人链接到您被阻止的站点时您的站点获得 SEO 排名。

解决方案 4:请求 Google 删除

http://support.google.com/webmasters/bin/answer.py?hl=en&answer=164734&from=61062&rd=1

解决方案 5:您可能想通过的其他工具很少

http://www.debianhelp.co.uk/htaccessweb.htm

于 2013-01-09T22:45:44.757 回答
1

使用 robots.txt 文件来告诉爬虫不要查看您的 pdf 文件 像这样:

User Agent: *
Disallow: /*.pdf$

这里

于 2013-01-09T22:34:01.183 回答
0

在 robots.txt 文件中添加

用户代理:
不允许:/
.pdf$

一段时间后,根据搜索引擎更新索引您的网站的速度。访问https://pdflookup.com输入您的 PDF 标题进行检查。您的 PDF 不会显示在搜索结果中。

于 2020-05-25T16:04:06.633 回答