我目前正在撰写我的论文,该应用程序将使用自然语言问答。我已经阅读了几个想法并关注了有关自然语言问答的讨论,但我似乎找不到好的答案。
问题:如何从 PDF、纯文本或 MS Word 文件中获取答案?
如果我想在 PDF 文件中搜索主题,我会使用Ctrl+F来查找主题/想法,但它不会返回所有详细信息;就像目录一样,它会给出一章的起始页和结束页。这就是我想要的逻辑。它将在不使用页码或编号的情况下确定章节的结束位置。有没有能够做到这一点的算法?
我目前正在撰写我的论文,该应用程序将使用自然语言问答。我已经阅读了几个想法并关注了有关自然语言问答的讨论,但我似乎找不到好的答案。
问题:如何从 PDF、纯文本或 MS Word 文件中获取答案?
如果我想在 PDF 文件中搜索主题,我会使用Ctrl+F来查找主题/想法,但它不会返回所有详细信息;就像目录一样,它会给出一章的起始页和结束页。这就是我想要的逻辑。它将在不使用页码或编号的情况下确定章节的结束位置。有没有能够做到这一点的算法?