我正在开发一个需要存储大量文档(PDF、Word 文件等)的系统。我正在使用 Solr/Lucene 搜索从这些文档中提取的相关信息,但我还需要一个存储原始文件的地方文件,以便用户可以打开/下载它们。
我在想几种可能:
- 文件系统 - 存储 1m 文件可能不是个好主意
- sql 数据库 - 但我不需要它的大部分关系功能,因为我只需要存储二进制文档及其 id,所以这可能不是最快的解决方案
- no-sql 数据库 - 对它们没有任何经验,所以我也不确定它们是否好用,它们中也有很多,所以我不知道该选择哪一个
我正在寻找的存储应该是:
- 快速地
- 可扩展的
- 开源(不重要但很高兴拥有)
您能否推荐您认为存储这些文件的最佳方式是什么?