1

我正在努力使用 R 中的 BigRQuery 包更新 Google BigQuery 中的表。我只设法修补了新列名,但没有更新值。

到目前为止,这是我的代码:

library(bigrquery)
library(tidyverse)
projectId = "ABCD"
datasetId = "test"
tableId = 'table1'

mydf = mpg #just loading an example dataset

x <- list(projectId = projectId,
          datasetId = datasetId,
          tableId   = tableId)

第一次上传表格

bq_table_upload(x, values = mydf, fields = as_bq_fields(mydf))

现在向 mydf 添加一列

mydf$new_column = 0

并尝试上传

bq_table_upload(x, values = mydf, fields = as_bq_fields(mydf)) 

这给出了表已经存在的错误。

我可以使用添加一个新列

bq_table_patch(x, fields = as_bq_fields(mydf))

但它到处都是用“Null”值创建的,我不明白如何在“new_column”中上传值(在这种情况下它们应该是 0)

任何帮助将不胜感激!

4

1 回答 1

2

我发现使用 DBI 可以做到这一点。

library(DBI)
DBI: dbWRiteTable

首先我们建立连接:

bq_conn <- dbConnect(bigquery(),
project = projectId,
dataset = datasetId)

接着

DBI::dbWriteTable(conn = bq_conn,
                  name = tableId,
                  value = df, 
                  as_bq_fields(df),
                  overwrite = TRUE, 
                  append = TRUE)

wheredf是一个新数据集,其中包含新行,其中至少有一些现有列的值。Append 和 Overwrite 当然可以根据需要选择 TRUE/FALSE。希望它可以帮助某人(我欢迎其他解决方案/建议使其变得更好 - 我是 GCP 和 R 的新手)。我的谷歌搜索结果只找到了一个未回答的问题:https ://community.rstudio.com/t/bigrquery-how-to-update-tables/31533

于 2019-11-28T14:34:06.927 回答