我正在寻找有关如何组织大量对象的建议。
假设传入率约为每天 60,000,000 个文件,我希望将它们保留 180 天。
使用每小时分区,顶层将有 4320 (24 * 180) 个目录。每个目录平均包含约 2,500,000 个文件。
如果我只需要通过完整路径单独获取文件并且不需要列出目录的内容,那么将所有 2500000 个文件保留在同一级别是否有任何问题?
或者我应该散列文件名并将它们存储在多个子目录中?(就像如果存储在传统文件系统上通常是如何完成的)
我正在寻找有关如何组织大量对象的建议。
假设传入率约为每天 60,000,000 个文件,我希望将它们保留 180 天。
使用每小时分区,顶层将有 4320 (24 * 180) 个目录。每个目录平均包含约 2,500,000 个文件。
如果我只需要通过完整路径单独获取文件并且不需要列出目录的内容,那么将所有 2500000 个文件保留在同一级别是否有任何问题?
或者我应该散列文件名并将它们存储在多个子目录中?(就像如果存储在传统文件系统上通常是如何完成的)