我每天都运行批量插入 cron 作业。但是有些值会丢失,当我重新运行数据时,这些值会添加到现有数据中,而不是更新。有没有办法只插入尚未插入的文档。
我的代码:
query = bigQuery.get_data(query)
bulk = col.initialize_unordered_bulk_op()
for i, row in enumerate(query):
bulk.insert({
'date': str(row['day_dt']),
'dt': datetime.strptime(str(row['day_dt']), '%Y-%m-%d'),
'site': row['site_nm'],
'val_counts': row[8]
})
bulk_result = bulk.execute()
现在,每次查询运行时它都会重新插入所有值。有没有办法只添加尚未添加的值。