2

我正在搜索如何不索引特定的 URL,但我没有找到关于以下内容的任何特定信息。

通过添加以下内容

<?php if(is_single(X)): ?>
<meta name="robots" content="noindex,nofollow">
<?php endif; ?>

我将无法索引 (X),其中 X 可能是帖子 ID,例如“Hello World”的帖子标题,或者“hello-world”的帖子 slug。

例如,是否可以指定所有以相同帖子或标题开头的 URL,如下例所示?

www.test.com/REF-123-mytest.html
www.test.com/REF-123-yourtest.html
www.test.com/REF-123-histest.html

例如,我可以省略所有以 REF-123 开头的 URL 吗?

4

2 回答 2

1

通过使用robots.txt,您可以禁止爬行

通过使用meta- robots(或 HTTP 标头X-Robots-Tag),您可以禁止索引

如果您打算禁止编入索引,则不应禁止 robots.txt 中的 URL,否则机器人永远不会知道您不希望这些 URL 被编入索引。

如果您想禁止抓取,可以使用此 robots.txt:

User-agent: *
Disallow: /REF-123

这将适用于路径以REF-123(区分大小写!)开头的所有 URL。

如果你想禁止索引,你可以在所有这些页面中添加这个 meta元素

<meta name="robots" content="noindex">

或发送相应的 HTTP 标头X-Robots-Tag

X-Robots-Tag: noindex
于 2014-11-13T15:07:07.087 回答
0

您可以在 robots.txt 文件中添加此规则:

Disallow: www.test.com/REF-123*
于 2014-11-13T09:25:30.327 回答