python - 是否可以附加到 xarray.Dataset？

Question

我一直在使用该.append()方法在 pandas 中连接两个表（具有相同的字段）。不幸的是，这种方法在中不存在xarray，还有其他方法吗？

score 26 · Accepted Answer

Xarray 没有 append 方法，因为它的数据结构是建立在 NumPy 的不可调整大小的数组之上的，所以我们不能在不复制整个数组的情况下追加新元素。因此，我们不实现append方法。相反，您应该使用xarray.concat.

一种常见的模式是在列表中累积 Dataset/DataArray 对象，并在最后连接一次：

datasets = []
for example in examples:
    ds = create_an_xarray_dataset(example)
    datasets.append(ds)
combined = xarray.concat(datasets, dim='example')

您不想在循环内进行连接——这会使您的代码在二次时间内运行。

或者，您可以为结果分配一个 Dataset/DataArray，并使用 indexing 填充值，例如，

dims = ('example', 'x', 'y')
combined = xarray.Dataset(
    data_vars={'my_variable': (dims, np.zeros((len(examples), 100, 200)))},
    coords={'example': examples})
for example in examples:
    combined.loc[dict(example=example)] = create_an_xarray_dataset(example)

（请注意，您始终需要使用带有方括号的索引，例如[]or .loc[]-- 分配sel()和isel()不起作用。）

这两种方法同样有效——这实际上是一个品味问题，哪一种对您来说看起来更好或更适合您的应用程序。

对于它的价值，pandas 具有相同的限制：该append方法确实在每次使用时都会复制整个数据帧。对于新用户来说，这是一个永久的惊喜和性能问题的根源。所以我确实认为我们做出了正确的设计决定，没有将它包含在 xarray 中。

score 2 · Accepted Answer

2

您可以使用.concat或 merge()。文档。

于 2015-10-30T12:34:31.243 回答

python - 是否可以附加到 xarray.Dataset？

2 回答 2

Related

Reference