我正在使用 Python 和一些 NoSql DB 来创建文件存储(主要是因为内置复制),我尝试使用 MongoDB 及其工作,但由于 MongoDB 的“写贪婪”性质,我搬到了 cassandra 并实现了相同的事物。虽然它工作,我想知道(指向我会很好的文档)如何对 cassandra 中的数据进行碎片整理。我将举例说明这一点,假设我上传了 200 MB 的文件,然后上传了 20 MB 的文件。现在 cassandra 中的数据大小约为 220MB。如果我去删除 200MB 的文件,那么我也会看到数据大小约为 200MB,因此不会获得空间。在 mongoDB 中有一个命令可以获取(重新使用相同的空间来存储新文件)我想知道如何在 cassandra 中实现相同的功能。我对黑白压缩和压缩感到困惑。
为了存储数据,我将部分拆分文件,然后在表中存储为“blob”。