1

据我所知,如果您在 where 子句中使用分区列,hive 分区可以减少输入文件的数量。例如,在我的表中定义了一个名为 date_entry 的分区(类型为字符串,用于存储时间戳)。

select count(*) from t where date_entry >= (unix_timestamp() - 2 * 24 * 3600) * 1000

我尝试执行此查询,我希望它会通过 where 子句过滤一些文件,但事实并非如此。如果我不使用函数 unix_timestamp() ,它将起作用。

任何人都可以知道为什么或给出解决方法。

4

0 回答 0