我正在研究 tensorflow 的 texsum 模型,它是文本摘要。我正在遵循github/textsum自述文件中指定的命令。它说数据文件夹中存在的名为验证的文件将在评估步骤中使用,但数据文件夹中没有验证文件。
我想自己做一个,后来意识到它应该是一个二进制文件。所以我需要准备一个文本文件,它将被转换为二进制文件。但是该文本文件必须具有特定的格式。会和train step中使用的文件一样吗?我可以对训练步骤和评估步骤使用相同的文件吗?我遵循的步骤顺序是:
第 1 步:使用提到的玩具数据集“更新”的词汇文件训练模型
第 2 步:训练持续了一段时间,在 running_avg_loss: 3.590769 处“被杀死”
第 3 步:使用与训练相同的数据和词汇文件进行 eval 步骤,我运行了 eval。它继续运行,running_avg_loss 在 6 到 7 之间
如果要使用相同的文件,我对第 3 步表示怀疑。