5

最近,我参加了一家公司的现场面试,并被问到与大数据相关的设计问题,例如:获取在时间 t1 和 t2 之间访问网站(比如谷歌)的用户列表。使用什么数据结构,如何处理并发,陈旧数据,需要多少台服务器来存储数据,以及每台服务器的需求(软件,硬件)等等......

请给我一些书籍/网络参考资料,以增加我在这个新领域的知识。还为我提供有关如何回答此类设计问题的见解

4

1 回答 1

3

这本书(免费下载)(亚马逊:海量数据集的挖掘)刚刚发布到HN(该线程也有一些有用的评论)——从第一次浏览开始,它看起来非常好。你可以读一下。

于 2012-08-12T01:34:27.783 回答