0

我创建了一个如下目录并使用以下语法创建配置单元表

a) 1) dfs -mkdir /app/hadoop/warehouse/

2)创建表employee(empid int, name string, surname string)行格式以','location '/app/hadoop/warehouse/'结尾的分隔字段;

3) load data inpath '/input file location .txt' overwrite into table employee;

如果我的理解是正确的,所有的块都存储在 /app/hadoop/warehouse/ 目录下。请确认 ?


b) hdfs-site.xml 中的 dfs.data.dir 参数的目的是什么,对于我们在这里提到的目录?


c) 我们在步骤 a) 中创建的目录应该在步骤 b) 中提及吗?

感谢您的澄清

谢谢纳文

4

1 回答 1

2

1) 在此处查看 Apache 文档以获取有关 dfs.data.dir 和其他属性的更多详细信息。

2)文件系统是对原始数据的抽象,因此块不存储在 /app/hadoop/warehouse/ 文件夹中。这些块存储在 DN 中,由 hdfs-site.xml 中的 dfs.data.dir 属性指定。

3) 在 Hive 中,逻辑表应该与 HDFS 中的数据相关联。因此,在创建表时应指定 HDFS 中的文件夹名称。

于 2013-10-11T05:48:43.877 回答