7

HDFS 和 GridFS 是分布式文件保存的两大技术,但它们有什么区别?哪种类型的问题更适合每个问题?

4

4 回答 4

3

HDFS 用于批处理(您知道,当您运行将逐个读取许多文件的查询时),但是当您执行随机访问操作时真的很糟糕,并且维护它会让人头疼或甚至部署(你知道,所有这些 Zookepers、Namenodes 等等)。另一方面,GridFS 在批处理时较慢,但在您执行大量随机访问但与 HDFS 相比具有更大存储开销的情况下则不然。

我会说你应该使用 HDFS 进行分析,使用 GridFS 来支持网站。

于 2012-05-22T13:33:18.547 回答
2

如果您使用 Hadoop,请使用 HDFS;如果您使用 MongoDB,请使用 GridFS。仅存储随机文件也不是那么好。它们是为与分析平台一起工作而构建的。

于 2012-01-31T11:15:30.713 回答
1

如果您只存储文件而没有任何分析和 map-reduce 作业,我建议您使用 GridFS。更容易定制和维护。我用于文件托管应用程序。在这种情况下,HFDS 是多余的。

于 2012-01-31T11:21:01.920 回答
0

GridFs 与其他 fs 相比有点慢...首先考虑其他 FS,例如 ceph ...

分布式文件系统 - 维基百科,免费的百科全书 -> http://en.wikipedia.org/wiki/Distributed_file_system

我认为 HDFS 是真正的 fs 但 GridfS 只是数据库网格

最后使用基准,但几乎没有建议分布式文件系统

于 2012-01-31T11:21:34.167 回答