从带有管道分隔符的大文件中创建具有大量列(字符串)(> 100)的 Hive 表的最佳方法是什么。
- 如果我在 create table 命令中提到超过 100 个列名,会不会有问题。
如果我决定不想命名每个列,我可以 a) 根本不提及列名,让 Hive 按照其默认命名来命名列名。我该怎么做 b) 只提到一些列说前 10 个。在这种情况下,其余列会发生什么情况?我试过这样:
CREATE EXTERNAL TABLE IF NOT EXISTS table1 ROW FORMAT DELIMITED FIELDS TERMINATED BY '|' LOCATION 'folder1/folder2/folder3/filename';
我收到一条错误消息,提示“应指定列列表或自定义序列化程序”。我需要一个自定义序列化程序吗?如果外部表没有分区,如何添加分区?