machine-learning - LUIS - 两个聊天机器人意图的类似训练话语

Question

前提：我正在使用ML Luis 框架来开发聊天机器人。这基本上是一个黑盒框架，我不知道如何以正确的方式调整它来解决这个问题。

我的聊天机器人有两个意图/类。为简单起见说：

是两个说的意图。在我的训练集中，我有两个课程：

喜欢类：

我喜欢

我喜欢猫

我真的很喜欢老鼠

不喜欢上课：

我不喜欢

我不喜欢海豚

我真的不喜欢狗

这两个类的训练集短语非常相似，当我尝试对属于两个类之一的短语进行一些预测时，分数非常接近，例如：

 I like armadillos -> 0.86 like | 0.8 don't like

基本上，这两个域/类有很大的重叠，并且只有一个词不同（不要如示例中所示）。有没有办法有效地训练模型（使用 Luis 1）增加相似话语之间的分数差异？

score 0 · Accepted Answer

LUIS 主要使用条件随机场(CRF) 来提取实体（参见此处）。由于 CRF 概率是根据单词序列计算的，在您的情况下，您无法更改 LUIS 中的任何因素。因为这两种情况下的单词顺序非常相似。

要解决此问题，您可以在 LUIS 之外进行一些处理，或者为 LUIS 准备更多话语以识别差异。但是，后一种解决方案可能没有我在第一段中解释的那么大帮助。

1 回答 1