我们有一个提高 BigQuery 准确性的问题,我们的使用案例如下,我们正在使用一个 16 亿条记录的表,一个对于我们的问题来说不是很大的表,并且我们正在尝试寻找唯一用户。
首先,我们认为使用“不同计数”,但正如文档中所说的大量数据,您可以获得估计结果。为了改善这一点,我们尝试使用“count + group by”代替“count distinct”语句。但是 bigquery 的结果是响应太大。我们首先按 UserID 分组,我们继续这个想法,但减少了数据数量,选择了特定的campaing,大大减少了数据量。但结果是一样的,反应太大了。
关于如何在 bigQuery 中准确获取唯一用户的任何想法或意见?