0

我有一个关于 api.ai 和 wit.ai 等聊天机器人平台如何工作的问题。您只需为每个意图/类提供几个模板,然后他们的系统就能够将新用户查询分类到这些类之一。我正在尝试做同样的事情,并测试了 SVM、逻辑回归、朴素贝叶斯和其他一些算法。对于特征提取部分,我已经尝试了人们通常使用的大多数特征,例如 n-gram、向量表示、弓等。在这种情况下,当每个类有几个模板时,最好的算法是什么?

谢谢阿米尔 :)

4

1 回答 1

0

你真的不能根据几个例子做任何好的分类。已建立的平台可以做到这一点的方式是寻找其他客户或系统创建者已经提供的类似意图、示例等,然后尝试推断。

所以关键是他们已经有一些先验数据,并且他们将分类结果基于该先验。

不过,您可以做的是挖掘任何您可以找到的开源资源,以获取与您的示例类似的示例。然后你可以尝试训练你的分类器。但是,无论如何,首先有一些合理的训练数据集是值得的。

于 2016-12-23T00:29:28.390 回答