我正在关注这个https://github.com/nshepperd/gpt-2 repo 来微调 gpt-2 355M 模型,我已经从 github 收集(注释、代码)对到一个文本文件中,其中数据具有以下格式 :
#comment
code
<|endoftext|>
这是微调 gpt-2 模型的正确格式吗?
我正在关注这个https://github.com/nshepperd/gpt-2 repo 来微调 gpt-2 355M 模型,我已经从 github 收集(注释、代码)对到一个文本文件中,其中数据具有以下格式 :
#comment
code
<|endoftext|>
这是微调 gpt-2 模型的正确格式吗?