我目前在会话多项选择上下文中使用 GPT-2 模型。
用法如下:2个对话者在同一个房间,一个对话者提出一个问题,第二个对话者有4个选择答案。
今天,我只使用选择的答案重新训练我的模型。我怎样才能整合非选择?如何惩罚未选择的答案?
我期待着你的想法和创造力:)
祝你有美好的一天,贾斯汀
我目前在会话多项选择上下文中使用 GPT-2 模型。
用法如下:2个对话者在同一个房间,一个对话者提出一个问题,第二个对话者有4个选择答案。
今天,我只使用选择的答案重新训练我的模型。我怎样才能整合非选择?如何惩罚未选择的答案?
我期待着你的想法和创造力:)
祝你有美好的一天,贾斯汀