0

我浏览了许多教程,通常会堆叠用户指向 pdfkitten 的链接,但是当我对其进行测试时,我对结果并不满意。所以搜索不适用于乘词等。

因此,我要查找的内容需要从 pdf 页面中获取所有单词,并在单词越过某个矩形时将其突出显示。

4

1 回答 1

2

我也使用了 PDFKitten。

  • 我所做的是在扫描 PDF 时 - 识别由空格分隔的单词。
  • 保存 RenderingState(PDFKitten 代码中的模型)单词,将该单词保存在模型中,其当前的 RenderingState(PDFKitten 代码中的模型)将是初始状态。当找到完整的单词(空格分隔)时,再次将当前的 RenderingState 保存为最终状态。
  • PDFKitten 中提供了使用上述初始状态和最终状态将 RenderingState 转换为实际视图框架的代码。你可以参考那个代码。
  • 将当前媒体框变换应用于帧。
  • 最后不要忘记将结果框架转换为用户的坐标系。否则你会观察到相反的效果。
于 2015-05-08T07:59:51.687 回答