假设我需要为文本文档建立一个存储。存储应该包含文档(只是文本文件)及其元数据:每个文档的创建日期和几十个标签。要存储的文档数量约为 10^6(每个文档约为 10K)。
主要语言是Java
,存储应该部署在Windows
.
用户应该能够将文档及其元数据存储在存储中,并按日期范围和标签搜索文档:例如,获取上周带有标签的所有文档:tag1和tag2。
假设我们将文档存储在文件系统中,并添加一个索引来存储文档名称(路径)、它们的日期和标签。你将如何建立索引?您会为此使用 RDBMS(例如mySQL
)吗?您会使用Lucene
或其他任何全文搜索引擎吗?