3

我正在考虑创建一个简单的聊天机器人,它可以使用 pdf 文件作为其源。例如,聊天机器人的输入可以是银行的条款和条件文档,聊天机器人会回答与文档内容相关的问题。

示例问答。问:我的储蓄账户的月费是多少?答:如果没有存款超过 2000 美元,您的储蓄账户的月费为 5 美元,否则免费。

我使用 pdfminer 读取 pdf 文档并将其转换为处理后的数据,并使用 spaCy 来识别 NER、POS 等。

我了解了 RASA,并且我看到的所有链接都使用定义的文本响应,而不是使用任何 pdf 文档作为来源。

有人可以就我可以遵循的方法提供任何指导吗?

我不想使用 Dialogflow 或 Lex,而是想进入开源世界。

4

1 回答 1

1

您正在寻找的是传统上可以通过深度学习解决的问答任务。在 Rasa 中,您主要可以根据查找表中的意图生成输出文本。但是要根据问题找到一些答案,您将需要额外的处理。

如果您正在寻找问答即服务,您可以查看QnA Maker并查看该线程,该线程还讨论了其他方法。

于 2019-09-19T08:02:19.697 回答