0

我正在尝试创建一个基于 ocr Web 的 pdf 查看器,用户可以在其中搜索手写文本。对于搜索功能,我将 pdf 图像发送到 django 服务器,它使用 tesseract 识别图像中的文本并返回一个字典,其中键作为单词,值作为坐标。我很困惑如何使用该字典来显示结果(该字典给出单词及其整个页面的坐标)。我尝试了 Boyer Moore 算法,但为此我需要在用户端将整个字典转换为字符串。

4

0 回答 0