1

我正在寻找按日期创建分区的最佳实践,使用amazon-redshift-spectrum,但示例显示了通过仅按一个日期对表进行分区来解决的问题。如果我有多个日期字段怎么办?

例如:带有user_install_date和的移动事件event_date

划分你的喜欢的表现如何s3

   installdate=2015-01-01/eventdate=2017-01-01
   installdate=2015-01-01/eventdate=2017-01-02
   installdate=2015-01-01/eventdate=2017-01-03

它会扼杀我的select表现吗?在这种情况下,最好的策略是什么?

4

1 回答 1

1

如果您的数据以上述方式分区,那么仅eventdate在 WHERE 子句(不带installdate)中的查询效率会降低。

它仍然需要查看每个installdate目录,但它可以跳过eventdate与谓词不匹配的目录。

将较少使用的参数放在第二位。

于 2017-10-06T22:57:15.303 回答