Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我将在索引之前和压缩方法之后存储数 TB 的信息。
我应该使用排序文件等手动编写二叉树数据库,还是使用 MongoDB 甚至 MySQL 之类的东西?
我担心每条记录的(空间)成本,比如 MySQL 和其他数据库。我也知道有些数据库甚至允许压缩,但它们转换为只读表。这些表/记录需要经常被新数据访问和覆盖。我想如果我用 C++ 编写一些东西,我就能将每条记录的空间成本降到最低。
我该怎么办?
现在有一些新的非关系数据库变得流行起来,专门用于管理大规模数据。
查看Hadoop或Cassandra,它们都在 Apache 项目中。