我有一个用双引号和逗号分隔的 CSV 文件。它看起来有点像下面这样:
“来自供应商的文本”,“供应商名称,Inc.”,“等等等等”,“下一个字符串”,“”,1234
我正在尝试使用 Hive 将其导入 Hbase 中的表中。
我可以使用以下内容在 Hbase 中从 Hive 创建一个表:
hive> CREATE TABLE exampletable1(tax_numb int, tax_name string, tax_addr string, tax_city string, tax_stat string)
STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
WITH SERDEPROPERTIES ("hbase.columns.mapping" = ":key,cf:tax_name,cf:tax_addr,cf:tax_city,cf:tax_stat")
TBLPROPERTIES ("hbase.table.name" = "hiveexampletable1");
我还能够向 Hive 添加一个表,在该表中我使用以下命令导入了 CSV 文件(尽管双引号存在问题):
hive> create table example2(tax_numb int, tax_name string, tax_addr string, tax_city string, tax_stat string) 以“,”结尾的行格式分隔字段,存储为文本文件;
但是,我无法将“分隔字段”位集成到我在 Hbase 中创建外部表的命令中。
由于我对 Hive-Hbase 组合相对较新,所以在到达我认为最好向社区寻求帮助的地步之前,我阅读了许多教程。我在谷歌上进行了多次搜索,但无济于事。
任何帮助/建议将不胜感激。