0

我一直在阅读这个主题,但无法找到正确的信息,我们一直在使用 Twitter Streaming、Datasift 和其他数据推送服务等服务。我想了解以下服务如何工作,

  1. 每秒收到的推文数量非常高。
  2. 许多人连接指定他们想要接收推文的关键字,这些可以是复杂的布尔查询。
  3. 针对所有这些布尔查询实时检查所有推文,然后将数据流式传输到正确的连接。

任何指向正在使用的架构类型的指针都会有所帮助。

4

1 回答 1

0

我认为您首先需要了解您试图理解的 twitter 等服务的规模和资源!性能可以通过管理照顾下面提到的两个方面来处理。

  1. 想象一下具有负载平衡器、多个 Web 服务器和具有分布式缓存的大型数据中心的多层生态系统!

  2. 无论算法性能的复杂性如何,都可以通过使算法多线程来管理!

如果您真的想了解,请尝试阅读 map-reduce、hadoop 等以获得一个想法

于 2013-10-10T07:21:16.123 回答