我的应用程序需要使用最大为 5 GB 的文本文件中的数据。我无法将所有这些数据加载到 RAM 中,因为它太大了。
数据像一个表一样存储,有 500 万条记录(行)和 40 列,每列都包含将在内存中转换为字符串、整数或双精度数的文本。
我尝试在内存中仅缓存 10 - 100 MB 的数据,并在需要外部数据时从文件中重新加载,但这太慢了!当我运行计算时,因为我可以从表中的任何行随机跳转,所以它需要不断地打开文件、读取和关闭。
我需要一些快速的东西,我正在考虑使用某种数据库。我知道这样的大数据计算可能需要一段时间,这很好。如果我确实使用了数据库,则需要在启动桌面应用程序时进行设置,并且之前不需要安装某种服务器组件。
有小费吗?谢谢