5

有没有办法使用 xarray 创建时间维度超过 2263 年的 netCDF 文件?

以下是如何创建 netCDF 玩具数据集http://xarray.pydata.org/en/stable/time-series.html

然而,时间维度有一种熊猫日期时间索引,并且不超过 2263,如下所示: https ://github.com/pandas-dev/pandas/issues/13346

4

2 回答 2

2

将来,您也许可以通过使用cftime对象创建日期轴来做到这一点,但就目前而言,存在一个突出的问题,xarray即不允许您编写包含此类对象的 netCDF 文件。

但是,即使您可以保存此类对象,最简单和最简洁的方法仍然是手动将该轴定义为具有某些单位的整数数组。

import numpy as np
import xarray as xr

days = np.asarray(range(100*365))

ds = xr.Dataset(
    {'time': (['time'], days, {'units': 'days since 2200-01-01 0:0:0'})}
)

print(ds['time'][-1]

ds.to_netcdf('test.nc')
ds = xr.open_dataset('test.nc')
print(ds['time'][-1])

给出输出

<xarray.DataArray 'time' ()>
array(36499)
Coordinates:
    time     int64 36499
Attributes:
    units:    days since 2200-01-01 0:0:0

其次是

<xarray.DataArray 'time' ()>
array(datetime.datetime(2299, 12, 7, 0, 0), dtype=object)
Coordinates:
    time     object 2299-12-07

请注意,当您重新打开数据集时,xarray 将自动对其进行解码。

您使用的“单位”属性应遵循时间坐标的CF 约定。您可以根据需要将“天”替换为“小时”、“分钟”或“秒”。

这确实需要您手动计算所需的整数,如果您的时间轴以年为单位,这主要是困难的(因为“年”不是定义的时间度量单位,它的长度会因闰年而异)。如果是这种情况,您可以使用以下内容:

import cftime

# replace this to use a different calendar
Datetime = cftime.DatetimeProlepticGregorian

# make your list of Datetime objects
time_list = []
month = day = 1
hour = minute = second = 0
for year in range(2200, 2300, 1):
    time_list.append(Datetime(year, month, day, hour, minute, second))

# this will convert them into a time axis, here in units of
# 'days since 2200-01-01 0:0:0'
seconds_in_day = 60*60*24
day_list = []
for dt in time_list:
    time_since_2200 = dt - Datetime(2200, month, day, hour, minute, second)
    day_list.append(int(time_since_2200.total_seconds() / seconds_in_day))

您可以使用不同的cftime类(例如cftime.DatetimeJuliancftime.DatetimeNoLeap)来使用不同的日历。应修改此代码以赋予time_list您使用的权利。您还可以seconds_in_day在其他时间单位中切换几秒钟(并将该单位提供给xr.Dataset呼叫)。

于 2018-04-25T22:43:04.843 回答
0

问题可能是 xarray 可以选择将 netcdftime 用于 datetime.datetime 范围之外的时间,但 pandas 没有。所以,即使安装了 netcdftime,像这个例子这样的东西也不起作用

import numpy as np
import pandas as pd
import xarray as xr
data = np.random.rand(4, 3)
locs = ['IA', 'IL', 'IN']
times = pd.date_range('2318-04-25', periods=4)
da = xr.DataArray(data, coords=[times, locs], dims=['time', 'space'])

当您尝试创建 pandas date_range 时,这将失败。即使提供 netcdftime.datetime 作为 pd.date_range() 的第一个参数也不起作用,因为 pandas 想要转换为自己的有限日期时间类型。

相反,您需要将时间直接指定给 xarray。不幸的是,这是我对 netcdf 的了解让我失望的地方,但我可以给你大纲,也许你可以从这里得到它。

有多种方法可以在 DataArray 参数中指定日期。您需要以 netcdftime.datetime 类型为基础创建自己的日期范围。您可以使用 netcdftime.date2index() 创建日期索引,并使用它代替上面示例中的 pandas DateIndex。

您可能应该发布显示问题的示例代码。我假设您正在尝试创建一个 DataArray,但也许这不是您遇到的问题。

于 2018-04-25T18:54:18.937 回答