0

我们目前正在托管一个大型 joomla 网站。Google 已经为我们网页的数百个“打印”版本编制了索引。

例如,如果我们有一篇带有 url 的文章:www.mysite.com/funnyarticle.html

自动创建的 joomla 站点:www.mysite.com/funnyarticle/print.html

我们已经移动了站点并删除了这些页面,因此他们现在从 google 收到 404 错误。我们想将“打印”网址重定向或重写(不确定正确的术语是什么)到他们各自的文章。

我想使用 htaccess 删除:/print.html

并将其替换为: .html

我看过一些例子,但无法让它们正常工作。所以我希望我能得到关于如何删除和替换上面的确切代码的具体建议。

谢谢你的时间。

问候,

前锋

4

4 回答 4

1

您可以使用以下行创建一个 robots.txt 文件。

User-agent: *
Disallow: /*/print.html

这将禁止搜索引擎机器人访问名为 print.html 的文件。

于 2012-07-11T06:34:04.790 回答
0

您可能想要使用RewriteRule. 请参阅 Apache 的指南了解如何使用它们:http ://httpd.apache.org/docs/2.0/rewrite/rewrite_guide.html

但是,如果您只是希望 Google(和其他搜索引擎)忽略这些印刷版本,请在您中输入相应的条目robots.txt。这样,您就不需要摆弄 Joomla 为您的人类访问者生成和访问打印版本的方式。

于 2012-07-11T06:33:09.313 回答
0

您需要将这些行放在您的DOCROOT/.htaccess文件中:

RewriteEngine On
RewriteBase   /

RewriteRule   ^(.*?)/print.html $1.html [L,R=301]

这会将任何点击到这些页面之一的 Google 用户重定向到正确的文章。如果您的文章名称可以包含 /?则从上面删除;该规则仍然有效,但可能需要更多 μS 运行时间 :-)

于 2012-07-11T09:13:48.377 回答
0

您可以使用 Jishnu 所说的 robots.txt。这是最好的方法。

User-agent: *
Disallow: /*/print.html
于 2014-05-10T14:40:14.240 回答