12

我似乎找不到任何关于谷歌如何确定你是否隐藏你的内容的信息。从技术角度来看,您认为他们是如何确定这一点的?他们是否发送了 googlebot 以外的内容并将其与 googlebot 结果进行比较?他们有一群人比较吗?或者他们能以某种方式告诉您已经检查了用户代理并执行了不同的代码路径,因为您在名称中看到了“googlebot”?

这与关于 seo 的合法 url cloaking 的问题有关。如果文本内容完全一样,但渲染不同(1995 年风格的 html vs. ajax vs. flash),真的有隐藏的问题吗?

谢谢你穿上这个。

4

7 回答 7

4

据我所知,谷歌如何准备搜索引擎结果是秘密的,并且在不断变化。欺骗不同的用户代理很容易,所以他们可能会这样做。在 Javascript 的情况下,它们还可能实际呈现部分或整个页面。“他们有人类团队比较吗?” 这是值得怀疑的。关于谷歌的抓取策略已经写了很多,包括这个,但如果涉及到人类,他们只会在特定情况下被调用。我什至怀疑这一点:花费的任何人力都可能是通过调整爬行引擎花费的。

于 2009-12-10T03:03:57.110 回答
2

实际上,谷歌的许多算法都被简单地颠倒了,与火箭科学相去甚远。在所谓的“伪装检测”的情况下,之前所有的猜测都是有钱的(有点讽刺的是,John K lol 除外)如果你不相信我设置了一些测试站点(输入)和一些'隐藏测试用例(进一步输入),将您的网站提交给 Google 叔叔(处理)并通过伪高级基于人类的认知相关量子感知测试您的非假设(<--顺便说一句,我弥补了娱乐价值(和现在我用括号括起来真的让你心烦意乱:))又名“检查谷歌结果,看看你是否被禁止”(输出)。循环直到启蒙 == True (noob!) 大声笑

于 2010-12-07T00:53:47.017 回答
2

谷歌在展示用户代理而不是 googlebot 的同时查看您的网站。

于 2009-12-10T02:54:38.917 回答
2

请参阅Google Chrome 漫画书第 11 页,其中描述了(甚至比外行的术语更好)Google 工具如何获取网页示意图。他们可以将这种或类似的技术用于谷歌搜索索引和隐身检测——至少这将是另一个很好的用途。

替代文字

于 2009-12-10T03:01:53.630 回答
2

谷歌确实雇佣了承包商(间接地,通过外部机构,以非常低的薪水)来手动审查作为搜索结果返回的文档,并判断它们与搜索词的相关性、翻译质量等。我高度怀疑这是他们唯一的工具检测隐形,但它就是其中之一。

于 2011-08-22T09:14:37.477 回答
1

一个非常简单的测试是将 Googlbot 看到的网页的文件大小与看起来像普通用户的 Google 别名用户扫描的页面的文件大小进行比较。

这将发现大多数可疑候选人进行更仔细的检查。

于 2016-05-13T14:28:06.243 回答
1

他们使用 curl 等工具调用您的页面,并在没有用户代理的情况下基于页面构建哈希,然后使用 googlebot 用户代理构建另一个哈希。两个散列必须相似,它们有算法来检查散列并知道它是否隐藏

于 2017-07-19T13:07:09.173 回答