我想知道是否可以保护“ https://www.DOMAIN.com:8443 ” URL 免受搜索引擎列表的影响,也许使用 htaccess 将 8443 端口从“DOMAIN”重定向到其他地方?
这是 VZPP Plesk - 登录 登录到 Plesk。请输入您的登录信息。用户名。密码。界面语言。用户默认,英语(美国),德语(德国)... https://www.DOMAIN.com:8443/ -
我想知道是否可以保护“ https://www.DOMAIN.com:8443 ” URL 免受搜索引擎列表的影响,也许使用 htaccess 将 8443 端口从“DOMAIN”重定向到其他地方?
这是 VZPP Plesk - 登录 登录到 Plesk。请输入您的登录信息。用户名。密码。界面语言。用户默认,英语(美国),德语(德国)... https://www.DOMAIN.com:8443/ -
您将需要创建一个robots.txt
包含以下内容的文件:
User-agent: *
Disallow: /
并将其放入usr/local/psa/admin/htdocs
. 请注意,位置可能因您的安装而异。
之后,验证该文件是否http://my.domain.com:8443/robots.txt
指向该文件并具有相同的内容。还要确保http://my.domain.com/robots.txt
(为您的公共站点提供服务的端口 [通常是隐含的端口 80])不指向同一个文件。如果是这样,那么您的网站将根本不会被索引。
该文件将告诉 Google 和其他机器人不要索引 Plesk 页面,例如登录页面。有关 robots.txt 的更多信息,请查看有关 robots.txt 的Google 帮助页面或从 Google 的搜索结果中删除页面或网站。此外,您可能希望将您的域添加到Google 网站管理员工具,并通过检查删除页面检查 Plesk 页面是否确实已被删除。
尝试使用(如果我正确理解了您的问题)
<meta name="robots" content="noindex,nofollow,noarchive"/>
和谷歌关于robots.txt ......不记得语法......
您可以在此处阅读有关使用带有 mod_rewrite 的用户代理检测的信息,如何为Google、Yahoo!设置您的 robots.txt , 和MSN/Live Search - 然而,这一切都假设有理智和合作的机器人。几乎没有什么办法可以防止攻击性的“黑帽”机器人。