0

我的理解是 Hadoop 需要一个大文件并将其保存在“数据块”块中。这些数据块是否存储在 T 文件中?数据块和T文件的关系是1-1吗?

4

1 回答 1

2

HDFS将大文件存储为一系列数据块(通常为固定大小,如 64/128/256/512 MB)。假设您有一个 1GB 的文件,并且块大小为 256MB - HDFS 会将这个文件表示为 4 个块。Name 节点将跟踪哪些数据节点拥有这些块的副本(或副本)。

T-Files是一种文件格式,包含键/值对。Hadoop 将使用 HDFS 中的一个或多个数据块存储 T-File(取决于 T-File 的大小和定义的块大小 - 系统默认值或文件特定)。

总之,您可以在 HDFS 中存储任何文件格式,它只会被分成固定大小的块,在整个集群中分布和复制。

于 2012-04-20T21:52:12.740 回答