我想在 HDFS(Hadoop 文件系统)上保存图像文件(如 jpeg、png 等)。我尝试了两种方法:
- 使用命令将图像文件按原样(即以相同格式)保存到 HDFS 中
put
。完整的命令是 :hadoop fs -put /home/a.jpeg /user/hadoop/
。它被成功放置。 - 将这些图像文件转换为 Hadoop 的格式,然后使用命令
Sequence File
保存在 HDFS 中。put
我想知道应该使用哪种格式保存在 HDFS 中。
以及使用Sequence File
格式的优点是什么。我知道的优点之一是它是可拆分的。还有其他吗?