3

在站长的问答网站上,我问了以下问题:

https://webmasters.stackexchange.com/questions/42730/how-does-indeed-com-make-it-to-the-top-of-every-single-search-for-every-single-c

但是,我想从开发的角度了解更多关于此的信息。

如果您在 Google 上搜索任何与工作相关的内容,例如 Gastonia Jobs (City + jobs),那么除了他们的搜索结果在 Google 的第一页中占主导地位外,您还会得到一个如下所示的 URL 结构:

indeed.com/l-Gastonia,-NC-jobs.html

我假设 L 代表 URL 结构中的位置。如果您搜索与行业相关的工作或具有特定公司名称的工作,您将得到类似以下内容(Microsoft 工作):

indeed.com/q-Microsoft-jobs.html

在美国只有 40,000 多个城市,我想,好吧,也许他们有可能遍历它们并为每个城市创建一个页面。这对计算机来说并不难。但是显然该站点是动态的,因为每个页面都有 10000 个结果并以 10 分页。上面的 q 显然代表查询。我可以理解的位置,但他们不可能为每个查询组合创建一个网页,对吗?

好吧,它变得有点奇怪。我想看看他们是否有站点地图,所以我在 Google 中输入了“indeed.com sitemap.xml”,得到了回复:

indeed.com/q-Sitemap-xml-jobs.html

.. 再次,我搜索了“indeed.com url structure”,正如我在网站管理员的另一篇文章中提到的那样,我回来了:

indeed.com/q-change-url-structure-l-Arkansas.html

Indeed.com 是否以某种方式使用编程根据我对谷歌的搜索输入动态创建网页?如果他们不是,他们如何能够为数百万和数百万可能的查询组合提供静态页面,让它们动态分页,然后让所有这些控制谷歌的第一页结果(尽管最后一个问题可能是最好的对于网站管理员 QA)?

页面中的 javascript 是否以某种方式与 URL 交互

4

4 回答 4

1

它很可能不是一堆页面。“实际”页面可能是http://indeed.com/?referrer=google&searchterm=jobs%20in%20washington。然后,该站点巧妙地使用 URL 重写生成人类可读的 URL,在数据库中获取与查询匹配的作业,然后瞧……

当然,我可能完全错了。说实话,它的技术方面可能可以通过多种方式解决。每次将作业添加到站点时,可能会创建与该作业匹配所需的所有页面,从而产生大量页面供 Google 抓取。

于 2013-01-28T20:44:27.457 回答
1

这是一个很好的问题,但是由于基本的 Google 搜索使用的原因仍未得到解答,

ste:indeed.com

返回超过 120MM 的结果,其次是“product manager new york”等查询在结果中排​​名第一。这些页面显然是预先生成的,这可以通过搜索引擎缓存的页面(有时是几天前)与网站上的实时查询有不同的结果来证实。

于 2013-03-11T17:28:29.057 回答
0

当 Google 的搜索机器人抓取确实或任何其他求职网站上的页面时,这些页面是动态创建的。这是另一个站点: http: //jobuzu.co.uk我运行这个站点,它与实际工作方式相似。

PHP 在这方面是您的朋友,并且确实不要只使用标准数据库来研究 Sphinx 和 Solr,因为它们提供全文搜索以获得比 MySql 等更好的性能。

于 2013-08-09T07:00:24.407 回答
0

他们还巧妙地利用了rel="canonical"和彻底的内部链接: http: //www.indeed.com/find-jobs.jsp

请注意,所有实际排名的页面都可以从该直接内部链接结构中找到。

于 2014-03-07T21:13:14.317 回答