我正在考虑创建一个简单的聊天机器人,它可以使用 pdf 文件作为其源。例如,聊天机器人的输入可以是银行的条款和条件文档,聊天机器人会回答与文档内容相关的问题。
示例问答。问:我的储蓄账户的月费是多少?答:如果没有存款超过 2000 美元,您的储蓄账户的月费为 5 美元,否则免费。
我使用 pdfminer 读取 pdf 文档并将其转换为处理后的数据,并使用 spaCy 来识别 NER、POS 等。
我了解了 RASA,并且我看到的所有链接都使用定义的文本响应,而不是使用任何 pdf 文档作为来源。
有人可以就我可以遵循的方法提供任何指导吗?
我不想使用 Dialogflow 或 Lex,而是想进入开源世界。