我在一次采访中被问到以下问题,我无法解决任何对此的指示将非常有帮助。
我有 100 个文件,每个文件大小为 10 MB,每个文件的内容都是一些字符串映射到整数值。
string_key=整数值
a=5
ba=7
cab=10 etc..
可用的物理 RAM 空间为 25 MB。如何设计数据结构:
For any duplicate string_key, the integer values can be added
Display the string_key=integer value sorted in a alphabetical format
约束:
All the entries of a file could be unique. All of the 10*1000MB of data could be unique string_key mapping to an integer value.
解决方案 1:
我正在考虑一个接一个地加载每个文件并将信息存储在哈希图中,但是这个哈希图会非常大,如果所有文件都包含唯一数据,那么 RAM 中没有足够的可用内存。
还有其他想法吗?
使用 noSqldb 不是一种选择。