我一直在将 Rasa NLU 用于一个涉及理解结构化文本的项目。我的用例要求我通过添加文本语料库实体的新示例来不断更新我的训练集。然而,这意味着我必须每隔几天重新训练我的模型,因此由于训练集大小的增加而需要更多的时间。
Rasa NLU 中是否有办法通过仅使用新的训练集数据对其进行训练而不是使用整个先前的训练数据集和新的训练数据集再次重新训练整个模型来更新已训练的模型?
我正在尝试寻找一种方法,我可以通过每隔几天使用增量附加训练数据集对其进行训练来简单地更新我现有的训练模型。
我一直在将 Rasa NLU 用于一个涉及理解结构化文本的项目。我的用例要求我通过添加文本语料库实体的新示例来不断更新我的训练集。然而,这意味着我必须每隔几天重新训练我的模型,因此由于训练集大小的增加而需要更多的时间。
Rasa NLU 中是否有办法通过仅使用新的训练集数据对其进行训练而不是使用整个先前的训练数据集和新的训练数据集再次重新训练整个模型来更新已训练的模型?
我正在尝试寻找一种方法,我可以通过每隔几天使用增量附加训练数据集对其进行训练来简单地更新我现有的训练模型。
迄今为止,关于该主题的最新 Github问题指出,无法重新训练仅添加新话语的模型。与其中引用的先前问题相同。
你是对的:不得不定期重新训练越来越长的文件变得越来越耗时。虽然,就地再培训在生产中并不是一个好主意。
用户评论中的优秀示例:
对同一模型进行再训练对于生产系统来说可能是个问题。我过去常常覆盖我的模型,然后在某些时候,其中一个训练不能完美地工作,我开始看到我的反应信心严重下降。我必须找到问题出在哪里并重新训练模型。
一直训练新模型(带有时间戳)很好,因为它使回滚更容易(并且它们将在生产系统中发生)。然后我从 DB 中获取最新的模型名称。