我对 Hadoop 生态系统有几个疑问。渴望很好地理解这些概念。
- Hive 表在哪里存储数据?
- 对于 Datawarehouse,我们是否需要在 Hive 和 Hbase 表中都有相同的数据。
- 我们如何从 Hbase 插入、更新、读取数据。
- HDFS 可以存储除 csv 之外的所有文件格式。
- 我们可以在 Hbase 上有 PIG 吗?
- 如果我有 Hive,我可以省略 Hbase 表吗?
答案,按顺序:
/user/hive/warehouse
,可通过 的hive-site.xml
属性进行调整hive.metastore.warehouse.dir
。hbase shell
.