1

我有很多现有数据,我想将它们用作 wit.ai 聊天机器人的训练数据。数据存储在 csv 文件中,其中每一行都有一个语句/问题和对该语句/问题的响应。

我知道 wit.ai 要求您为所做的评论分配意图,所以我想知道是否有一种方法可以简单地发送我拥有的数据并让聊天机器人开始自行学习意图。

谢谢!

4

2 回答 2

2

感谢您发布。我们知道这还不完美,但我们在几天前发布了一个导入/导出功能。查看 json 导出的结构,可以轻松地输入现有数据。它需要为每个陈述/问题和回应创建一个故事。更多信息: https ://wit.ai/docs/recipes#copyexportversion-my-app

于 2016-06-30T18:33:32.903 回答
1

“教学”Wit.Ai 并不是某些人可能认为的那样。

您将不得不为您的User says专栏创建故事。老实说,这些答复是无关紧要的。你不能“教”wit.ai 回复。回复在故事或您的代码中定义。

wit.ai 可能需要从您的数据中获取关键字和关键短语,以使 wit.ai 更好地识别实体。

这是最简单的例子:

在此处输入图像描述

color根据列出的关键字识别实体。因此,如果您有大量数据作为用户输入的示例 - 您可以尝试首先将其分解为“用户输入应该产生哪些实体”,然后是这些输入中的关键字。

将您的数据用于“教学” - 会有点困难,因为它需要您在 wit.ai 中创建大量故事来涵盖可能的用户输入和实体识别。但你仍然可以这样做:

(粗略的例子)

  1. 例如,制作一个关于用户询问时间的故事
  2. 在用户输入中标记应从该输入派生哪些实体: 在此处输入图像描述
  3. 对您的列表进行排序,以获得所有可能的询问时间的方式:
    • 多晚了?
    • 能告诉我现在的时间吗?
    • 我想知道现在几点了?
  4. 使用脚本 ( Python ) 在您的故事中“拍摄”所有这些用户输入。
  5. 完成后 - 转到了解 wit.ai 的时间并完成所有输入更正\添加您定义的实体。

如果实体是基于关键字或其他算法的,此过程将“教导”实体。

这是我能想到的关于如何使用现有数据的最好方法。Wit.Ai 与其他语言处理工具集不同,用现有数据“教”它有点“令人费解”:)

于 2016-06-14T08:05:25.347 回答