我有一个 CouchDB 数据库,它主要存储文档附件。
文件在 db 中排序,URL 结构如下:/db-name/numeric-file-id/official-human-readable-file-name.ext
一份文件始终只有一个附件。今天我计算了所有文件的 md5 总和,似乎其中许多是重复的。
我想知道 couchdb 是否知道重复的附件并在内部仅存储某种指向文件的指针,并跟踪引用计数,或者只是按原样存储每个附件。
我的意思是,如果我将 5 个相同的 100MB 文件作为附件,数据库将使用 100MB 还是 500MB?