我有一个宽大的平面表,以以下类似格式存储在 Google bigquery 中:
log_date:integer,sessionid:integer,computer:string,ip:string,event_id:integer,amount:float
我正在尝试以分层嵌套格式创建此表,具有 2 个嵌套级别,如下所示:
[
{
"name": "log_date",
"type": "integer"
},
{
"name": "session",
"type": "record",
"mode": "repeated",
"fields": [
{
"name": "sessionid",
"type": "integer"
},
{
"name": "computer",
"type": "string"
},
{
"name": "ip",
"type": "string"
},
{
"name": "event",
"type": "record",
"mode": "repeated",
"fields": [
{
"name": "event_id",
"type": "integer"
},
{
"name": "amount",
"type": "float"
}]] } ]
从 bigquery 表生成 json 格式的数据文件的最佳方法是什么?有没有比 1. 将表下载到外部 csv 2. 构建 json 记录,并将其写入外部文件 3. 将外部 json 文件上传到新的 bigquery 表中不同且更快的方法
我们可以有一个从现有表生成 json 的直接过程吗?
谢谢你,H