最近,我参加了一家公司的现场面试,并被问到与大数据相关的设计问题,例如:获取在时间 t1 和 t2 之间访问网站(比如谷歌)的用户列表。使用什么数据结构,如何处理并发,陈旧数据,需要多少台服务器来存储数据,以及每台服务器的需求(软件,硬件)等等......
请给我一些书籍/网络参考资料,以增加我在这个新领域的知识。还为我提供有关如何回答此类设计问题的见解
最近,我参加了一家公司的现场面试,并被问到与大数据相关的设计问题,例如:获取在时间 t1 和 t2 之间访问网站(比如谷歌)的用户列表。使用什么数据结构,如何处理并发,陈旧数据,需要多少台服务器来存储数据,以及每台服务器的需求(软件,硬件)等等......
请给我一些书籍/网络参考资料,以增加我在这个新领域的知识。还为我提供有关如何回答此类设计问题的见解