我有超过 1 亿个字符串要存储在文件系统上。连同字符串 (~255Chars utf8) 将有两个日期和一些定义其属性的整数值。
我可以将它们放在一个 CSV 文件中,但它会很大。我可以将几个较小的 CSV 文件放在子目录中以使其更快,或者我可以简单地为每个字符串创建一个文件并将它们存储在目录树中。
我如何知道哪种解决方案更快、更容易维护/开发?我什至不知道我的弦有多稀疏;也许我有 5000 万个以相同的字符开头,从而使树不那么平衡。
现在我想我可以用前 5 个字符创建一个目录结构,然后将 csv 文件放在每个目录中。例如。字符串“我不知道我在做什么”->“Idontknowwhatimdoing”进入
/i/d/o/n/t/list.csv
有更好的主意吗?我不能使用 Db。我使用 java 来存储和 php 来读取文件系统,如果这有什么不同的话。