0

我正在尝试对 Big Query 执行一些探索性数据分析,但遇到了问题。我的 SQL 知识相当欠发达,在 BQ 方面更是如此。这段代码:


DECLARE columns ARRAY<STRING>;
DECLARE query STRING;
SET columns = (
  WITH all_columns AS (
    SELECT column_name
    FROM `your-client.staging.INFORMATION_SCHEMA.COLUMNS`
    WHERE table_name = 'churn'
  )
  SELECT ARRAY_AGG((column_name) ) AS columns
  FROM all_columns
);

SET query = (select STRING_AGG('(select count(distinct '||x||')  from `your-client.staging.churn`) '||x ) AS string_agg from unnest(columns) x );
EXECUTE IMMEDIATE 
"SELECT  "|| query
;

是我正在尝试使用的部分。它在 Kaggle 的流失数据集(14 列和 10k 行)上运行,但我的要大得多(145 列和 ~72m)行。尽管人口稀少,但我收到以下错误:

Resources exceeded during query execution: Not enough resources for query planning - too many subqueries or query is too complex.. at [1:1]

我听说解决这个问题的一个好方法是使用物化视图来创建临时表而不是使用,WITH但我不知道从哪里开始。

对此或任何其他解决方案的任何帮助将不胜感激。

非常感谢!

4

0 回答 0