我将整个数据集作为元组列表保存在内存中,其中每个元组对应于一批固定大小的 'N' 。IE
(x[i],标签[i],长度[i])
- x[i]:形状为 [N,W,F] 的 numpy 数组;这里有 N 个例子,每个例子有 W 个时间步长;所有时间步都有固定数量的特征 F
- label[i] : class: shape [N,] 一个用于批处理中的每个示例
- 长度[i]:数据中的长度(时间步数):形状[N,]:这是批处理中每个示例的时间步数(W)
主要问题:不同批次的 W 不同。
我正在查看 Dataset API 的以下示例和文档,但无法理解如何为我的案例创建 DataSet 对象。API 之类的 Dataset.from_tensor_slices 和 Dataset.from_tensor 似乎无法正常工作(抛出广播错误),因为它们要求张量具有相同的形状,即批次之间的 W 相同。有什么方法可以不用填充我的批次(使用 DataSet.padded_batch)?