3

我们目前正在使用谷歌表格进行一项关于 Covid-19 病例和死亡人数人群预测的研究项目。

使用 Google 表格是为了方便,但我们经常遇到配额限制问题——即使我们拥有的用户数量应该远低于 Google 允许的数量。

我试图通过设置一个新的谷歌帐户并创建一个可供阅读的工作表来创建一个可重现的示例。

我尝试的第一件事(没有对谷歌帐户进行任何更改)是这样的:

library(googledrive)
library(googlesheets4)

# Google sheets authentification -----------------------------------------------
options(gargle_oauth_cache = ".secrets")
drive_auth(cache = ".secrets", email = "iamatestotest@gmail.com")
gs4_auth(token = drive_token())

sheet_id <- "1Z2O5Mce_haceWfduLenJQP-hddXF9biY_4Ydob_psyQ"

n_tries <- 50

for (i in 1:n_tries) {
  data <- read_sheet(ss = sheet_id)
  Sys.sleep(0.5)
  print(i)
}

据我了解,我应该能够每分钟发出大约 300 个读取请求,但我通常无法让循环运行超过 30-34。

由于我不确定这 300 个请求是否随时可用,我访问了https://console.cloud.google.com,创建了一个新的测试项目(不知道为什么需要这样做)并明确激活了 googlesheets API 并创建了一些凭据. 我创建了一个 API 密钥以及一个 OAuth 2.0 客户端 ID(尽管我承认有些迷失了它的作用以及如何使用它)。

API 配额

接下来我尝试通过运行使用我的 api 密钥登录

drive_deauth()
drive_auth_configure(api_key = "thisismyapikey")
gs4_auth(token = drive_api_key())

但这也没有让我超过 33 岁。我还查看了谷歌控制台,但也看不到任何流量 - 所以不确定我的 API 密钥是否被实际使用?

API 使用图

我认为这是由于我无法以预期的方式实际使用 API。任何有关设置/增加配额的帮助将不胜感激。如果这有帮助,我很乐意提供对测试帐户的访问权限 - 只需给我留言。

4

2 回答 2

1

非常友好的人的帮助下,我想我主要是想通了这一点,这确实是我未能正确使用 API。

为什么我的方法失败了

当您使用 googlesheets4 及其任何开箱即用的功能时,系统会要求您授权 tidyverse API OAuth 应用程序(您使用 Google 凭据登录并授予 OAuth 应用程序访问权限)。这意味着您通过 tidyverse OAuth 应用程序发出所有请求,世界上使用此功能的所有其他用户也是如此。这非常好,因为它开箱即用,但如果其他人同时使用该软件包,则会遇到限制。与其他人共享这个配额意味着我遇到了非常不可预测的限制。

如何更改设置以使其正常工作

有几件事有助于缓解/解决问题。

  1. 使用 googlesheets4 的 devtools 版本devtools::install_github("tidyverse/googlesheets4")。这个 googlesheets4 的开发版本又依赖于 的开发版本gargle,管理 google 身份验证的包。开发版本的gargle具有重试功能,如果它们失败,它会自动重试您的请求。这应该解决大部分问题。

  2. 获取您自己的 OAuth 应用程序/谷歌服务帐户。 这使您可以自行管理身份验证过程。因此,您不必与世界各地的其他用户共享您的配额。要设置您自己的 OAuth 应用程序 / google 服务帐户,您可以执行以下操作(我在这里专注于 google 服务帐户,因为这在实践中要容易得多)。

  • 登录https://console.cloud.google.com/。您将被要求创建一个项目。您可以在“Google Cloud Platform”旁边的左侧看到您的项目。在此处输入图像描述
  • 在搜索栏中键入“API 和服务”,按“启用 API 和服务”并搜索工作表。启用此 API。
  • 返回搜索栏并输入“凭据” 在此处输入图像描述
  • 按“创建凭据”并选择服务帐户。服务帐户可让您以编程方式访问 API。给它一个名称和描述。您应该能够跳过可选部分。创建服务帐户并返回凭据概览。您可能需要刷新页面或等待一分钟。
  • 单击您的服务帐户(它看起来像一个非常神秘的电子邮件地址)并转到“KEYS”选项卡。
  • 单击“添加密钥”并创建一个新密钥。作为密钥类型,选择 JSON。
  • 下载该密钥并将其存储在安全的地方。这应该被视为密码和用户名的组合!
  • 现在要实际使用您的密钥googlesheets4,您可以运行 `gs4_auth(path = "path-to-your-service-account.JSON") 在此处输入图像描述
  • 为了能够访问您的 google 表格,您需要授予您的服务帐户权限。转到您的谷歌表格,按共享(就像您与任何其他用户共享它一样)并输入这个神秘的服务帐户电子邮件(它应该看起来像“1234@something.iam.gserviceaccount.com”。一切都应该工作现在无需您在任何地方登录。如果您以前尝试过其他事情,我建议您重新启动您的 R 会话。
  • 利润。

您现在还应该能够在 google 控制台仪表板中跟踪 API 请求。

请注意,每个用户每分钟仍有 60 个请求的限制,因此您无法获得完整的 300 个请求,但也许可以创建多个服务帐户并平衡它们之间的负载。但是不让别人的要求干扰你的要求是一个很大的进步!

于 2021-02-26T14:39:43.113 回答
0

谷歌表示这是一种安全措施。尝试通过添加他们的电子邮件来分享

于 2021-02-26T14:35:33.197 回答