tensorflow - TensorFlow 的数据集 API：可变大小的输入

翻译自：https://stackoverflow.com/questions/46359079 2017-09-22T07:25:40.857

1849 次

我将整个数据集作为元组列表保存在内存中，其中每个元组对应于一批固定大小的 'N' 。IE

(x[i],标签[i],长度[i])

x[i]：形状为 [N,W,F] 的 numpy 数组；这里有 N 个例子，每个例子有 W 个时间步长；所有时间步都有固定数量的特征 F
label[i] : class: shape [N,] 一个用于批处理中的每个示例
长度[i]：数据中的长度（时间步数）：形状[N，]：这是批处理中每个示例的时间步数（W）

主要问题：不同批次的 W 不同。

我正在查看 Dataset API 的以下示例和文档，但无法理解如何为我的案例创建 DataSet 对象。API 之类的 Dataset.from_tensor_slices 和 Dataset.from_tensor 似乎无法正常工作（抛出广播错误），因为它们要求张量具有相同的形状，即批次之间的 W 相同。有什么方法可以不用填充我的批次（使用 DataSet.padded_batch）？

tensorflow - TensorFlow 的数据集 API：可变大小的输入

0 回答 0

Related

Reference