0

我打算用rasa从零开始构建一个聊天机器人。现在最大的困难是如何自动化生产训练数据。训练数据包括nlu.md和story.md。

rasa-nlu-trainer和Chatito我都试过了,但是还是有很多手动操作,如果以后有上万的语料库。如何标记数据,使数据符合nlu.md的数据格式和故事.md

是否有自动化工具或程序来执行此操作?非常感谢!

4

1 回答 1

2

好吧,如果您正在做任何与 ML 相关的事情,那么您的数据是模型学习所需的最重要的东西。因为我们希望模型从这些数据中学习,所以我们创建数据,然后用它训练模型。你所要求的是以某种方式为其创建数据的东西。正是因为不存在这样的东西,我们才创建数据集来自己训练人工智能,以便模型从中学习。那么,如果您将数据创建过程自动化,您希望模型学习什么?

因此,您无法自动创建数据,因为如果可能的话,我们现在已经拥有通用人工智能 (AGI)。

但是,如果您的目标只是格式化数据,那么您可以为此编写一个脚本。

于 2019-09-16T08:27:48.797 回答