出于天气处理的目的,我希望在 Google Cloud Storage 中自动检索每日天气预报数据。
这些文件在公共 HTTP URL ( http://dcpc-nwp.meteo.fr/openwis-user-portal/srv/en/main.home ) 上可用,但它们非常大(在 30 到 300 兆字节之间)。文件大小是主要问题。
在查看了之前的stackoverflow主题之后,我尝试了两种不成功的方法:
1/ 通过 Google App Engine 中的 urlfetch 第一次尝试
从 google.appengine.api 导入 urlfetch url = "http://dcpc-nwp.meteo.fr/service..." 结果 = urlfetch.fetch(url) [...] # 保存在 Google Cloud Storage 存储桶中的代码
但我在 urlfetch 行收到以下错误消息:
DeadlineExceededError: 等待来自 URL 的 HTTP 响应时超过了最后期限
2/ 通过 Cloud Storage Transfert 服务进行第二次尝试
根据文档,可以通过 Cloud Storage Transfert 服务直接将 HTTP 数据检索到 Cloud Storage 中: https ://cloud.google.com/storage/transfer/reference/rest/v1/TransferSpec#httpdata
但它需要下载前文件的大小和md5。此选项不适用于我的情况,因为该网站不提供这些信息。
3/有什么想法吗?
您是否看到任何解决方案可以将 HTTP 上的大文件自动检索到我的 Cloud Storage 存储桶中?