我一直在收集数据以BigQuery
进行分析。但是,数据量在增长,我只需要 2 周的近期数据。我想删除未使用的数据。我做了一些研究,发现分区数据有一个过期选项。
当前设置:
我的表是一个分区表我使用带有类似代码的 Lambda 函数来将数据放入表中(我尝试添加 timePartitioning 选项,但它不起作用,所以这就是为什么我在 stackoverflow 上询问是否有人知道)
wait bq
.dataset("dataset name")
.table('tablename' + '$' + partitionTime)
.load( filename, {
sourceFormat: 'CSV',
schema,
skipLeadingRows: 1,
timePartitioning: {
expirationMs: "300000"
}
});
其中 partitionTime 的格式为 YYYYMMDD(这会将插入该分区的数据放置)
感谢您的所有评论并花时间阅读我的麻烦 :) 祝您有美好的一天。