我创建了一个聊天机器人并添加了训练数据(数百个)并对其进行了训练,直到现在它都很好。但是当我添加更多的训练数据时,大约 50,000 甚至更多。现在,我被困在这里 RASA NLU 无法训练那么多的训练数据,它可以训练多达 20,000 个训练数据,但不能超过。我收到“错误:无法分配内存”
问问题
229 次
您可能必须修剪您的训练集以便为新示例留出空间。您不需要为模型提供所有可能的单词组合。它擅长泛化,甚至学习一组稀疏的组合。
当您使用 50k 示例时,我想您已经在使用工具来生成它们。如果它可以帮助您进行修剪,您可以查看文档,或者切换到当前推荐的,可以。