到目前为止,我使用 bigrqueryquery_exec
从 BigQuery 下载时间序列数据。
sql <- "SELECT Date, val1, val2
FROM `mydata`
WHERE DATE(_PARTITIONTIME) BETWEEN '2020-05-01' AND '2020-06-01'"
project <- "myproj"
df <- query_exec(sql, project = project, max_pages = Inf, use_legacy_sql = FALSE) %>% as_tibble()
自上次更新以来,会出现一条警告,指示query_exec
已弃用,而应与 结合使用bq_table_download
。bq_project_query
tb <- bq_project_query(project, sql)
df <- bq_table_download(tb, page_size = 100000)
调整我的代码导致数据框大小(超过 400 万行)与使用query_exec
. 但是,从 ~80000 行开始,现在只出现格式为 1970-01-01 的日期,其余列要么为空,要么包含零。使用旧方法query_exec
仍然有效,并导致格式正确的数据帧。
有什么想法可能是这里的问题吗?