pdf - 在pdf页面上搜索的最佳方法是什么

翻译自：https://stackoverflow.com/questions/68517393 2021-07-25T09:47:18.573

20 次

我正在尝试创建一个基于 ocr Web 的 pdf 查看器，用户可以在其中搜索手写文本。对于搜索功能，我将 pdf 图像发送到 django 服务器，它使用 tesseract 识别图像中的文本并返回一个字典，其中键作为单词，值作为坐标。我很困惑如何使用该字典来显示结果（该字典给出单词及其整个页面的坐标）。我尝试了 Boyer Moore 算法，但为此我需要在用户端将整个字典转换为字符串。

pdf - 在pdf页面上搜索的最佳方法是什么

0 回答 0

Related

Reference