1

我需要索引多达 500,000 个条目以获得最快的阅读速度。索引需要定期在磁盘上重建。我试图在一个简单的文件(如磁盘上的哈希)或嵌入式数据库中的单个表之间做出决定。我不需要 RDBMS 引擎。

4

7 回答 7

1

也许是BDB?这是一个高性能。不使用 DBMS 的数据库。

于 2008-09-16T00:54:00.437 回答
1

cdb如果数据没有改变。

/艾伦

于 2008-09-16T01:34:36.410 回答
1

PyTables Pro 声称“对于不需要快速更新或删除的情况,OPSI 可能是最好的索引引擎之一”。不过我没有亲自使用过,但是 PyTables 的 F/OSS 版本已经给了你很好的性能:

http://www.pytables.org/moin/PyTablesPro

于 2008-09-16T01:41:37.577 回答
1

如果您通过键存储状态对象,那么Berkeley DB怎么样。

于 2008-09-16T00:59:07.680 回答
1

我假设您指的是关系 DBMS(如 mySql、Oracle 或 Postgres)上的索引表。

索引是辅助数据存储,它按特定顺序保存表的字段子集的记录。

如果创建索引,任何包含在其 WHERE 子句中索引的字段子集的查询都将执行得更快。

但是,添加索引会降低 INSERT 性能。

通常,除非索引损坏,否则不需要重建索引。它们应该由您的 DBMS 动态维护。

于 2008-09-16T00:22:40.950 回答
0

这就是MapReduce的发明目的。Hadoop是一个很酷的 java 实现。

于 2008-09-16T00:20:39.987 回答
0

如果数据不需要完全是最新的,您可能还想考虑使用用于 OLAP 目的的数据仓库工具(例如MSOLAP)。可以基于预先计算的数据执行闪电般快速的只读查询。

于 2008-09-16T00:27:57.177 回答