我想对其中包含多个文件的多个目录运行计数配置单元查询。文件路径如下所示
'2011/01/01/file20110101_01.csv
2011/01/01/file20110101_02.csv
2011/01/02/file20110201_01.csv
2011/01/02/file20110201_02.csv'
等等。
我创建了一个具有以下分区的外部表
'create external table table1(col1,col2...)
partitioned by (year string,month string)
STORED AS TEXTFILE'
并尝试将分区添加到该月。
'ALTER TABLE partition_test_production1 ADD PARTITION(year='2011', month='01')
LOCATION 'blob path/2011/01/*/file201101*.csv';'
试过这个查询
'select count(1) from table1 where year='2011' AND month='01';'
但计数显示为零。关于如何做到这一点的任何建议?