1

我正在尝试将我在本地运行的Seq2Seq 模型转换为使用EstimatorExperiment的 Tensorflow 分布功能。基本特征和目标设置如下:

for every input and response (translation or prompt and response):
  raw input -> tokenized input -> tokenized response -> raw response

笔记:

  • 特征将具有形状 [桶数] [输入数量@桶大小] [桶的大小用于输入]
  • 目标将具有形状 [桶数] [响应数@桶大小] [响应桶大小]

几个问题:

  1. 一般来说,是否建议使用 Experiment 类和 Estimator 接口来处理这种模型?
  2. 我可以使用 Experiment 设置训练批量大小吗?它似乎train_stepseval_steps训练和评估的迭代有关。是否有另一个选项可以为这些步骤设置批量大小,或者实验是否在内部/自动计算批量大小?
  3. 我假设 Experimenttrain_input_fn并且eval_input_fn可以是返回特征字典和目标张量的任何input_fn 。在上面的例子中,我真的只需要一个特征张量和一个目标张量,因为我正在创建一个自定义的 Estimator,只要我的 Estimatormodel_fn期望这些形状并且可以正确地从它们返回损失,它们就可以是任何形状。这个对吗?
4

0 回答 0