0

我们需要将日志中的数据上传到 Google BigQuery,并且我们有两个日志数据子集,它们在查询时不会重叠。

  1. 第一个子集有一个字段“vendor_id”,它将在 WHERE 子句中大量使用。
  2. 第二个子集是没有“vendor_id”的日志条目

我们可以只创建一个带有可为空的“vendor_id”字段的表,或者为每个子集创建两个不同的表。这些方法的性能有什么不同吗?

问候

狮子座

4

1 回答 1

2

您提到的两个选项之间的查询性能几乎没有(如果有的话)差异。也就是说,查询的成本与读取的数据量成正比,因此如果您有两个单独的表,它可能会更便宜,因为每个查询将读取较少量的数据。

于 2013-04-18T22:37:08.037 回答