1

为了每次都展示最匹配的广告,至少需要做以下这些事情:

  1. 检索当前页面的主要信息
  2. 获取与上面检索到的信息相关的广告

但以上对于非搜索引擎公司来说几乎是不可能的。

那么对于非谷歌公司来说,接近最佳匹配广告系统的实用方法是什么?

4

2 回答 2

5

您基本上无法实时执行第 1 点——时间间隔太短了。因此,您需要事先分析您将在其上投放广告的所有页面,并以在投放广告时可以快速访问的方式存储这些信息。

这并不一定意味着“成为一家搜索引擎公司”:毕竟,您可能不会在数十亿个不同的 URL 上投放广告,而只会在属于您公司或其合作伙伴的少数几个 URL 上投放广告(因此您可能还可以从 URL 的所有者那里获得协作:例如,您不需要通用蜘蛛,但可以依靠所有者正确使用站点地图协议来让您了解新的、更新的或删除的 URL,您可以信任每个页面的关键字、标题和标题以提供重要信息等)。

因此,使用相对较少数量的服务器(比如几十个,可能在 EC2 或其他“云”服务中),您可以保留一个内存分布式哈希表,将 URL 映射到(例如)相关关键字集和关键字权重'相对重要性,以及候选广告的类似表格 - 事实上,如果您的系统没有“实时拍卖”方面,您甚至可以预先计算 URL-to-ads 对应关系(大概想做一些动态调整,拍卖方式或其他方式,但有一些合理的近似值,可以建模为预先计算的对应关系的简单增量操作)。

如果您确实需要扩展以在数十亿个 URL 上投放广告,那么您确实需要一种比 SO 答案有效总结的更复杂的方法——但是,如果这是您的雄心壮志,那么您最好将它们放在一起一个不被任务吓倒的工程团队(以及远远超过几十台服务器;-)。

于 2010-04-09T14:28:18.017 回答
0

当客户注册在他们的网站上放置广告时,您需要告诉您他们的页面是关于什么的。您还需要非常擅长 javascript,以便跟踪广告被查看的次数。尝试查看现有广告公司使用的代码。它非常复杂...

于 2010-04-09T14:21:24.803 回答