我正在开展一个旨在分析从各种终端收集的生物特征数据的项目。该过程对性能不是很关键。相反,它是 I/O 有界的。数据量非常庞大。(每张表有数亿条记录)。不幸的是,数据库是关系型的。并且有20个外键。在作业完成期间更改引用键的值非常常见。所以在收集数据的过程中会有很多 UPDATE 和 SET NULL 。
目前,设计了数据库的语义。所有程序几乎完成,并且创建了数据库的 MySQL 原型。它适用于样本(小规模)数据。
我进行搜索以找到适合该项目的 DBMS。谷歌搜索“DBMS 比较”,......没有帮助。人们说对立的事情。有人说 MySQL 会执行更快的插入和更新,有人说 Oracle9 更好......
我在 DBMS 之间找不到任何可靠的、基于基准的比较。我在日常项目中使用 MySQL,但这个看起来更重要。
我们需要的:
- DBMS 的许可和成本并不重要,但当然首选开源(GPL 或 LGPL)(因为整个项目将在 LGPL 下发布)。
- 非常快的插入,非常快的更新,需要大量的外键。
- DBMS 应一次响应 0 - 100 个连接。
- 终端通过本地网络 (LAN) 连接到服务器。
我真正在寻找的是各种 DBMS 的基准。它可能包含图表、不同操作(插入、更新、删除)在各种情况下(与引用字段或普通表的关系)的单独比较......