我正在使用Rasa.ai构建一个机器人。使用 Rasa NLU 训练机器人时,我们使用一个训练数据文件,其中指定了文本、意图、实体等。例如对于一个简单的餐厅聊天机器人,训练文件data.json
可能包含
{
"text": "central indian restaurant",
"intent": "restaurant_search",
"entities": [
{
"start": 0,
"end": 7,
"value": "central",
"entity": "location"
},
{
"start": 8,
"end": 14,
"value": "indian",
"entity": "cuisine"
}
]
}
我们用它来训练模型。但是我们需要手动(或通过 GUI)创建这个训练文件。
有什么工具可以让我输入句子并自动创建意图和实体?
Sample Input: Is there any central Indian restaurant?
Sample Output: The above data.json
编辑:
为了更好地解释这个问题 - 假设我有大量的客户服务通话记录。我的理解是使用 Rasa(或其他类似框架)——人类需要通过调用日志并了解过去发生的所有可能的意图、实体组合,并data.json
在训练模型之前创建一个像上面这样的文件。这似乎是一个非常不可扩展的问题。data.json
有没有一种方法可以在不涉及人类的情况下从这些 GB 大小的通话记录中生成该文件?我在这里错过了什么吗?