0

我目前在会话多项选择上下文中使用 GPT-2 模型。

用法如下:2个对话者在同一个房间,一个对话者提出​​一个问题,第二个对话者有4个选择答案。

今天,我只使用选择的答案重新训练我的模型。我怎样才能整合非选择?如何惩罚未选择的答案?

我期待着你的想法和创造力:)

祝你有美好的一天,贾斯汀

4

0 回答 0