1

我目前正在撰写我的论文,该应用程序将使用自然语言问答。我已经阅读了几个想法并关注了有关自然语言问答的讨论,但我似乎找不到好的答案。

问题:如何从 PDF、纯文本或 MS Word 文件中获取答案?

如果我想在 PDF 文件中搜索主题,我会使用Ctrl+F来查找主题/想法,但它不会返回所有详细信息;就像目录一样,它会给出一章的起始页和结束页。这就是我想要的逻辑。它将在不使用页码或编号的情况下确定章节的结束位置。有没有能够做到这一点的算法?

4

1 回答 1

0

我使用iTextPDF来阅读 PDF 文件内容。

于 2012-11-25T01:27:52.400 回答