问题标签 [duplicate-content]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
86 浏览

solr - solr:如何保留不同 URL 的重复内容

我们的内部网络中有一些网页具有相同内容的相似页面(例如 UPS 管理控制台)。solr 总是只保留其中一个,因为它们具有相同的摘要。

所有 4 个已删除的重复项都具有不同的 url。我想将它们全部保存在 solr 中,而 solr 仍然可以删除其他类型的重复内容。我猜默认情况下该 url 不用于生成摘要,所以有没有办法设置使用该 url?我还有什么其他选择?

0 投票
2 回答
1235 浏览

dns - 当多个域名显示同一个网站时,避免来自搜索引擎的重复内容

我正在尝试弄清楚如何在多个域上正确显示一个网站。

鉴于:

1 个具有 1 个 IP 地址的 Web 服务器。(1.1.1.1)

100 个不同的域名。(example.com、example.net、example.co、example.biz 等)

我希望所有 100 个域名都显示从 1 个网络服务器提供的内容。

在我看来,实现这一点最有效的方法是使用 DNS,如下所示:

example.com 区域文件

example.net 区域文件

example.co 区域文件

等(为简洁起见,上述示例仅省略了其他 DNS 记录,即 SOA)

以前没有使用过这些域,因此它们没有排名。

在我看来,使用 301 重定向会引入大量的服务器和维护开销。实际上,每个域都需要为此“单独”托管,并且每个域都需要一个 IP 地址(可能是共享 IP)。

对于上面的示例,搜索引擎是否会将 1 个网络服务器返回到每个域的内容视为重复内容?或者搜索引擎是否足够聪明,知道虽然域名不同,但所有内容的 IP 地址都是相同的,并且知道它只有在解析 CNAME 查找后才获得该内容?

0 投票
2 回答
892 浏览

.htaccess - 使用 mod_rewrite Codeigniter 重复内容

在 codeigniter 中,一旦你启用了短 URL,你就有可能重复内容,因为虽然你的新 URL 看起来像:

http://domain.com/privacy_policy

您仍然可以手动访问旧链接,这些链接在您输入时仍会加载:

http://domain.com/index.php/privacy_policy

根据手册,我的 htaccess 文件如下所示:

我应该怎么做才能解决这个问题?

0 投票
1 回答
53 浏览

.htaccess - 通过 htaccess 删除尾部斜杠

根据谷歌的建议,我尝试在我的 .htaccess 中添加一些代码以防止重复内容。这是我的代码:

这段代码运行良好,只是有一个小问题:

此代码更正以下链接:

但它不纠正以下链接:

请帮忙。谢谢你。

0 投票
1 回答
116 浏览

php - URL 重写 - 通过手动重写避免重复内容

我有这个重写模式:/blog/post-url-variable-ID,它工作正常。

由于 ID 是从 dba 中选择数据的决定性变量,我想通过手动重写 URL 来避免重复内容。

例如:由于ID而/blog/my-new-post-777具有相同的内容。/blog/anything-written-here-777

所以我写了这段代码,它在本地运行完美,直接重定向到好的 URL。

由于我将它转移到我的服务器,它不再工作。我还尝试通过 header:location 直接简化到主页,但它看起来不起作用。

我意识到当 header:location 位于页面的最顶部时,它可以正常工作。但由于 $variables 在它下面,它不能调用它们。

有任何想法吗 ?我现在很迷茫!

0 投票
2 回答
1567 浏览

seo - SEO - 具有相同关键字但内容不同的多个页面

我有一个这个网站

http://www.webtrainingcentre.com/

这是关于网络开发教程的。

我的问题是我可以有多个具有相同关键字但内容不同的页面,例如。

这是一个关于php中if/else条件的教程页面

http://www.webtrainingcentre.com/php-tutorials/if-else-condition/

我想创建几个这样的页面

所有这些页面都会有不同的内容,这些内容需要并且有意义

我在 wordpress 中使用 SEO Yoast 插件,它说您使用了重复的关键字。

我想知道谷歌是否会理解这些是具有不同上下文/内容的不同页面并且是用户需要的,还是会因为我在页面标题和网址中使用重复的关键字而受到惩罚。

0 投票
1 回答
1263 浏览

apache - 如何使用 htaccess 避免重复的内容映射 url

我对编写 htaccess 规则有点陌生。我想让我网站中的网址尽可能简单。

假设我想为根域“映射” /home/ 目录。因此,http://www.domain.com将显示 /home/ 目录中的内容而不更改 url。

此外,我不希望用户/谷歌访问:http://www.domain.com/home/,因此,如果有人访问该 URL,我想将他们重定向回我的根域:http:/ /www.domain.com

我看到谷歌正在索引具有相同重复内容的两个目录。 http://www.domain.com http://www.domain.com/home/

我能做些什么来阻止这一切吗?我不想使用 robots.txt,因为我听说这是一种不好的做法。

如果我启用此代码中的所有行,我会得到一个永不结束的重定向循环。

此外,在尝试添加“seo 友好”网址时,我也遇到了同样的问题。我正在尝试将“ http://www.domain.com/thread/thread-name/ ”映射到“ http://forum.domain.com/thread-name/ ”,虽然它工作正常,但我m 仍然有 2 个显示相同内容的重复 URL。

我想听听避免搜索引擎索引重复内容的最佳做法。我应该将其重定向到 404 吗?我不想使用 robots.txt 来实现它,因为有很多文件/目录组合,它不适合我的目的。

非常感谢!

0 投票
2 回答
107 浏览

seo - 重复内容和国际网站澄清

有些事情不清楚,这是我的情况:我想为我们和英国人提供相同的内容,我可以安全地避免与那些网址重复的内容:
www.example.us/info.html(托管在我们的服务器上)
www .example.co.uk/info.html(托管在英国服务器上)

来自谷歌: 为不同地区和不同语言提供内容的网站有时会创建相同或相似但在不同 URL 上可用的内容。只要内容针对不同国家的不同用户,这通常不是问题。虽然我们强烈建议您为每个不同的用户组提供独特的内容,但我们知道这可能并不总是可行的。通常不需要通过在 robots.txt 文件中禁止抓取或使用“noindex”机器人元标记来“隐藏”重复项。但是,如果您在不同的 URL 上向相同的用户提供相同的内容(例如,如果 example.de/ 和 example.com/de/ 都为德国用户显示德语内容),您应该选择一个首选版本并适当地重定向(或使用 rel=canonical 链接元素)。此外,您应该遵循关于 rel-alternate-hreflang 的指南,以确保向搜索者提供正确的语言或区域 URL。

对我来说似乎不清楚,你对我的案子有什么看法?!

弗劳

0 投票
2 回答
138 浏览

php - php:在文件/嵌套循环中查找重复内容

我已经抓取了 5000 个文件,将它们存储在单独的文件中(0-4999.txt),现在我需要在其中找到重复的内容。所以我在嵌套循环(ETA 82 小时)中将每个文件相互比较。这种方法肯定需要几个小时才能完成。我主要关心的是没有。的迭代。任何人都可以提出一种更好的方法来减少迭代并减少花费的时间吗?

当前代码:NCD算法

循环遍历每个文件:

0 投票
1 回答
101 浏览

.htaccess - 301重定向域名更改

我的朋友想将她的域 oldsite.com 更改为 newsite.com。

托管公司是 lukrativedomains,他们建议将域更改为 newsite.com,然后将 oldsite.com 转发到 newsite.com

但是,他们提供的转发功能会将所有页面重定向到根 newsite.com。我希望能够将 oldsite.com 的所有单个页面转发到 newsite.com 上的同一页面

我是否需要将 oldsite.com 中的内容复制到 newsite.com,然后实施 301 重定向?如果是这样,我该怎么做,那会是重复的内容吗?

另外,我将如何为每个页面进行 301 重定向?我需要她什么?(htaccess?如果是的话那会在哪里?)

截至目前,newsite.com 上没有任何内容,它只是一个停放的页面,但我希望它看起来与 oldsite.com 完全一样。

在尽量减少对 SEO 的影响的同时做到这一点非常重要。她不使用wordpress,事实上,我不确定内容在哪里(我猜是在某个地方的ftp)