2

我们的 BigQuery 用例有点独特。我想开始使用日期分区表,但我们的数据非常最终。它在发生时不会被插入,但最终会在它被提供给服务器时被插入。有时这可能是在插入任何数据之前的几天甚至几个月。因此,_PARTITION_LOAD_TIME 属性对我们来说毫无用处。

我的问题是有没有一种方法可以指定像 _PARTITION_LOAD_TIME 参数一样的列,并且仍然具有日期分区表的好处?如果我可以手动模拟并相应地更新 BigQuery,那么我可以开始使用日期分区表。

有人在这里有好的解决方案吗?

4

1 回答 1

2

您不需要创建自己的列。
_PARTITIONTIME 伪列仍然适用于您!
您唯一需要做的就是通过引用表名而不是带有分区装饰器的表来将相应的数据批次插入/加载到相应的分区中 - 比如 yourtable$20160718
这样您就可以将数据加载到它所属的分区中

于 2016-07-18T21:19:21.940 回答