我正在处理一项分析任务,我们从大学图书馆获得了包含近 300.000.000 行的部分数据集。
每行包含:
- ID
- 日期
- 所有者
- 最后期限
- 离开日期
- 登记日期
我把所有这些都放在一个 MySQL 表中,然后我开始查询它以用于我的分析任务,但是简单的查询 ( SELECT * FROM table WHERE ID = something
) 需要 9-10 分钟才能完成。所以我为所有列创建了一个索引,这使它明显更快~ 30 秒。
所以我开始阅读类似的问题,人们建议切换到“宽列存储”或“搜索引擎”而不是“关系”。
所以我的问题是,用于这些数据的最佳数据库引擎是什么?