我正在尝试将我在本地运行的Seq2Seq 模型转换为使用Estimator和Experiment的 Tensorflow 分布功能。基本特征和目标设置如下:
for every input and response (translation or prompt and response):
raw input -> tokenized input -> tokenized response -> raw response
笔记:
- 特征将具有形状 [桶数] [输入数量@桶大小] [桶的大小用于输入]
- 目标将具有形状 [桶数] [响应数@桶大小] [响应桶大小]
几个问题:
- 一般来说,是否建议使用 Experiment 类和 Estimator 接口来处理这种模型?
- 我可以使用 Experiment 设置训练批量大小吗?它似乎
train_steps
与eval_steps
训练和评估的迭代有关。是否有另一个选项可以为这些步骤设置批量大小,或者实验是否在内部/自动计算批量大小? - 我假设 Experiment
train_input_fn
并且eval_input_fn
可以是返回特征字典和目标张量的任何input_fn 。在上面的例子中,我真的只需要一个特征张量和一个目标张量,因为我正在创建一个自定义的 Estimator,只要我的 Estimatormodel_fn
期望这些形状并且可以正确地从它们返回损失,它们就可以是任何形状。这个对吗?