我从Google 文件系统论文中不明白这一点
一个小文件由少量块组成,也许只有一个。如果许多客户端访问同一个文件,存储这些块的块服务器可能会成为热点。
一个小文件有什么不同?许多客户端访问的大文件不是同样可能导致问题吗?
我曾想过/阅读以下内容:-
- 我假设(如果我错了,请纠正我)大文件块存储在不同的块服务器上,从而分配负载。在这种情况下,假设 1000 个客户端从每个块服务器访问文件的 1/100。所以每个 chunkserver 不可避免地会收到 1000 个请求。(与访问单个小文件的 1000 个客户端不同。服务器收到 1000 个小文件请求或 1000 个大文件部分请求)
- 我读了一些关于稀疏文件的内容。小文件根据文件填满一大块或几块。因此,据我了解,不会重建小文件,因此我已将其排除为热点的可能原因。