问题标签 [bigquery-udf]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
362 浏览

sql - *BigQuery 存储过程中的参数

BigQuery 参数中是否有任何概念*args(类似于 pytho *args)

我正在编写一个通用存储过程,它将检查表是否有重复的行。显然,列数会在运行时变化并给出。

所以我想用来*args接收参数,解压它们并在动态 SQL 中使用它们。

提前感谢您的回复。

0 投票
1 回答
330 浏览

google-bigquery - BigQuery 是否支持分析用户定义的函数?

BigQuery 支持:

  1. SQL 和 JavaScript 中的用户定义函数(UDF)。
  2. 计算一组行的值并为每行返回一个结果的分析函数。这些函数可以与OVER子句一起使用。有一组预定义的分析函数。

问题 #1:“BigQuery 是否支持分析用户定义的函数?”

这背后的动机是我想实现Python pandas 代码中常见的split-apply-combine模式。这对于组内标准化和使用组统计的其他转换可能很有用。

我在标准 SQL 中做了一个小测试:

当我运行上面的代码时,我得到:

查询错误:函数 mydataset.mylen 在 [16:3] 不支持 OVER 子句

因此,如果 BigQuery 确实支持分析 UDF,那么问题 #2:“如何实现 UDF 以使其支持 OVER 子句?”

0 投票
1 回答
54 浏览

stored-procedures - BigQuery 存储过程 SQL%RowFound

如何检查存储过程中的 SQL 语句是否成功返回了一行或多行。以下是我正在检查特定表是否有重复项的存储过程。我不确定如何在存储过程中编写 IF 语句

0 投票
1 回答
669 浏览

google-bigquery - BigQuery 在创建用户定义的函数时缺少数据集错误

我正在尝试使用这样的 sql 查询在 BigQuery 中创建简单的用户定义函数:

注意:这不是真正的函数,它只是返回浮点值的虚拟函数

我认为,这是一个有效的 SQL 语句,但我有这个错误:

Routine name "distance_traveled_between_time" missing dataset while no default dataset is set in the request.

而且我现在不知道要解决什么问题。有谁知道?

0 投票
1 回答
328 浏览

google-bigquery - 从 BigQuery UDF 中的参数查询表

我正在尝试创建一个 UDF,它将为每个作为参数传递给 UDF 的表找到名为“DatePartition”的字段的最大值。我创建的 UDF 如下所示:

但我收到以下错误:“表名“x”缺少数据集,而请求中未设置默认数据集。”

表名将以以下格式传递给 UDF:

my-project.my-dataset.my-table

编辑:添加更多上下文:我有多个表,每天早上用昨天的数据更新。有时表格的更新时间比预期的要晚,所以我正在创建一个视图,允许用户快速查看每个表格中的最新数据。为此,我需要在一个语句中计算所有这些表的 MAX(DatePartition)。表列表将存储在另一个表中,但它会不时更改,因此我无法对其进行硬编码。

0 投票
2 回答
61 浏览

sql - 我想在 BigQuery 中使用表达式的特定列上的最大列值对记录进行重复数据删除

我想删除公司名称,CO LLC而是希望保留Amar CO所有列,Amar CO LLC因为它具有minimum NULL值或最大列数据。

简而言之:对记录进行重复数据删除,删除以 LLC 结尾或匹配的公司名称(不区分大小写),但保留两个具有最大信息列的记录中的值。

预期产出

0 投票
1 回答
229 浏览

google-bigquery - BigQuery 脚本:根据表列中包含的每一行运行 SQL 查询

我的原始表包括url_idSQL [标准 sql,字符串]

在此处输入图像描述

我想运行字符串列“SQL”中的每个 SQL 语句,并将结果与​​对应的 url_id 连接起来

预期结果

在此处输入图像描述

更新

为了便于重现,我从公共 BQ 导入了一个类似的模式:

bigquery-public-data.covid19_italy.data_by_province

在此处输入图像描述

如果我跑

它返回 在此处输入图像描述

0 投票
1 回答
29 浏览

google-bigquery - GoogleBigQuery How to exclude null values from a specific column in a union query?

I would like to filter out null values from a specific column in this case "Account" on a union query how can i do this?

The query that I am working on is this:

SELECT Account, Campaign_name, Ad_group_name, Date, Keyword, Impressions, Clicks, Cost__GBP_, Conversions FROM table1 UNION ALL

SELECT Account, Campaign_name, Ad_group_name, Date, Keyword, Impressions, Clicks, Cost__GBP_, Conversions FROM table2

Someone can help me in this? Thanks

0 投票
1 回答
182 浏览

google-bigquery - Google Big Query:如何将数据类型从字符串更改为浮点数?

我有以下查询,我想将“Reach”字段的数据类型从字符串更改为浮点数。

我正在处理的查询如下:

我收到以下问题:(谷歌大查询无法将值转换为浮点数。第 8 行;第 8 列)

我试图通过执行以下操作来修改查询: CAST (Reach AS Float64) As Reach ,但它不起作用。

有人可以帮我吗?

谢谢

0 投票
2 回答
47 浏览

google-bigquery - 如何对特定列中的字符串值进行分组,并使用分组字符串创建和附加列?

我有以下架构:

查看活动、日期、来源___媒体、关键字、会话、New_sessions__、Avg__session_length__sec_、用户、New_users、跳出、Goal_completions_all_goals

我想将源/中字符串名称项目分组到特定组中:

例如,在来源和媒体中,我有 google/Organic、google/discovery、google/CPC、付费/搜索、Facebook/社交等字段,我想将它们分组为 Google Organic、Video Discovery、Google CPC、付费搜索、Facebook有机等。我该怎么做?

然后,当我创建了分组列时,我如何能够将此列添加到原始列?