我有很多现有数据,我想将它们用作 wit.ai 聊天机器人的训练数据。数据存储在 csv 文件中,其中每一行都有一个语句/问题和对该语句/问题的响应。
我知道 wit.ai 要求您为所做的评论分配意图,所以我想知道是否有一种方法可以简单地发送我拥有的数据并让聊天机器人开始自行学习意图。
谢谢!
我有很多现有数据,我想将它们用作 wit.ai 聊天机器人的训练数据。数据存储在 csv 文件中,其中每一行都有一个语句/问题和对该语句/问题的响应。
我知道 wit.ai 要求您为所做的评论分配意图,所以我想知道是否有一种方法可以简单地发送我拥有的数据并让聊天机器人开始自行学习意图。
谢谢!
感谢您发布。我们知道这还不完美,但我们在几天前发布了一个导入/导出功能。查看 json 导出的结构,可以轻松地输入现有数据。它需要为每个陈述/问题和回应创建一个故事。更多信息: https ://wit.ai/docs/recipes#copyexportversion-my-app
“教学”Wit.Ai 并不是某些人可能认为的那样。
您将不得不为您的User says
专栏创建故事。老实说,这些答复是无关紧要的。你不能“教”wit.ai 回复。回复在故事或您的代码中定义。
wit.ai 可能需要从您的数据中获取关键字和关键短语,以使 wit.ai 更好地识别实体。
这是最简单的例子:
color
根据列出的关键字识别实体。因此,如果您有大量数据作为用户输入的示例 - 您可以尝试首先将其分解为“用户输入应该产生哪些实体”,然后是这些输入中的关键字。
将您的数据用于“教学” - 会有点困难,因为它需要您在 wit.ai 中创建大量故事来涵盖可能的用户输入和实体识别。但你仍然可以这样做:
(粗略的例子)
如果实体是基于关键字或其他算法的,此过程将“教导”实体。
这是我能想到的关于如何使用现有数据的最好方法。Wit.Ai 与其他语言处理工具集不同,用现有数据“教”它有点“令人费解”:)