我正在按照本教程微调 gpt-2 模型:
与其关联的 GitHub 存储库:
https://github.com/nshepperd/gpt-2
我已经能够复制这些示例,我的问题是我没有找到设置迭代次数的参数。基本上,训练脚本每 100 次迭代显示一个样本,并每 1000 次迭代保存一个模型版本。但我没有找到一个参数来训练它,比如 5000 次迭代然后关闭它。
训练脚本在这里: https ://github.com/nshepperd/gpt-2/blob/finetuning/train.py
编辑:
正如 cronoik 所建议的,我正在尝试将 while 替换为 for 循环。
我正在添加这些更改:
添加一个额外的参数:
parser.add_argument('--training_steps', metavar='STEPS', type=int, default=1000, help='表示模型应训练多少个训练步骤的数字')
改变循环:
try: for iter_count in range(training_steps): if counter % args.save_every == 0: save()
使用新参数:
python3 train.py --training_steps 300
但我收到了这个错误:
File "train.py", line 259, in main
for iter_count in range(training_steps):
NameError: name 'training_steps' is not defined