我有一个 JSON 映射/字典,我想在其中找到最大值,但我在编写 UDF(使用旧版 SQL 语法)时遇到问题。我在网上找不到很多资源或示例,但我确实看到了很多标准 SQL。任何人都可以提供使用旧版 SQL 处理地图、字典和用户定义函数的帮助或良好的在线示例吗?谢谢!
示例输入: {“cat_age”: 14, “dog_age”: 4} (这是我表中的列,我们称列名“AgeColumn”)
输出: 14
我有一个 JSON 映射/字典,我想在其中找到最大值,但我在编写 UDF(使用旧版 SQL 语法)时遇到问题。我在网上找不到很多资源或示例,但我确实看到了很多标准 SQL。任何人都可以提供使用旧版 SQL 处理地图、字典和用户定义函数的帮助或良好的在线示例吗?谢谢!
示例输入: {“cat_age”: 14, “dog_age”: 4} (这是我表中的列,我们称列名“AgeColumn”)
输出: 14
以下是 BigQuery 标准 SQL
#standardSQL
SELECT col,
(
SELECT AS STRUCT CAST(SPLIT(item, ':')[SAFE_OFFSET(1)] AS INT64) age, item
FROM UNNEST(SPLIT(REGEXP_REPLACE(col, r'{|}', ''))) item
ORDER BY CAST(SPLIT(item, ':')[SAFE_OFFSET(1)] AS INT64) DESC
LIMIT 1
).*
FROM `project.dataset.table`
您可以使用虚拟数据进行测试,使用上面的示例,如下例所示
#standardSQL
WITH `project.dataset.table` AS (
SELECT '{“cat_age”: 14, “dog_age”: 4}' col UNION ALL
SELECT '{“cat_age”: 11, “dog_age”: 16}'
)
SELECT col,
(
SELECT AS STRUCT CAST(SPLIT(item, ':')[SAFE_OFFSET(1)] AS INT64) age, item
FROM UNNEST(SPLIT(REGEXP_REPLACE(col, r'{|}', ''))) item
ORDER BY CAST(SPLIT(item, ':')[SAFE_OFFSET(1)] AS INT64) DESC
LIMIT 1
).*
FROM `project.dataset.table`
结果
Row col age item
1 {“cat_age”: 14, “dog_age”: 4} 14 “cat_age”: 14
2 {“cat_age”: 11, “dog_age”: 16} 16 “dog_age”: 16