0

我正在将客户聊天消息分为 5 类。类别的示例是 - 登录、SSL 等。例如,如果客户遇到登录问题,消息可能会显示如下内容 - 我遇到登录问题或我的登录无效......我们必须考虑拼写错误,提及多个分类关键字(例如:我刚刚升级了我的 SSL,但现在我遇到了登录问题)等。

有没有可以用来解决这个问题的模型/api?

4

1 回答 1

0

我认为您的问题非常广泛,因为您的问题本质上是关于文本分类的,并且在文献中它已经从大多数 NLP 分类算法中面临,所以有比深度学习更多的选择(也许在你的情况下更好)。但是,如果您想使用深度学习,您不仅需要考虑架构(简单的多层、卷积、LSTM 等),还需要考虑进行良好训练所需的标记数据量(以及用于文本分类的无监督算法呢? )。

然后,独立于您决定的方法,我强烈建议您检查单词嵌入算法(预训练或使用您自己的数据构建),特别是那些类似于fasttext的算法,因为它可以让您处理拼写错误的单词

我希望这有帮助

于 2018-05-05T01:26:02.263 回答