我正在使用入口来访问目录catalog.ocean.GFDL_CM2_6.GFDL_CM2_6_control_ocean_surface。目前我只处理这些数据的一小部分,但每次访问这些数据仍然非常昂贵(它在谷歌云存储上)。所以我想使用摄入的持久选项在本地存储该数据。然而,据我从文档中了解到,看起来一个人只能持久化整个数据集。对于那个特定的数据集,如果我以每 GB 0.1 美元的成本计算,那将达到近 400 美元,因为总数据是 3976GB。
因此我的问题是:
- 有没有办法(特别是对于理论上应该使这很容易的 zarr 文件)仅保留部分数据(例如仅保留变量的子集)
- 这可能更复杂,但我可以通过持久化我感兴趣的数据区域(例如坐标值)来进一步推动事情吗?