0

我想从 PDF 文件中的表格中获取文本? 在此处输入图像描述

我无法在表格中获取单元格。我试图运行 Leadtools 的示例,但它无法自动检测单元格。

https://www.leadtools.com/help/leadtools/v20/dh/fo/iocrtablezonemanager.html

你能给我建议吗?谢谢大家

4

1 回答 1

0

在与您发布的图像类似的表格中,您应该能够使用 IOcrPage.TableZoneManager.AutoDetectCells() 方法找到单元格。此方法在当前版本的 LEADTOOLS 附带的 OcrMultiEngineDemo 项目中使用。

以下是测试它的方法:

  1. 运行 OCR 多引擎演示。
  2. 选择 OmniPage OCR 引擎
  3. 打开包含表格的图像或 PDF 文件。
  4. 在桌子周围画一个区域。
  5. 从 OCR->Zones 菜单中选择“Update Zones...”。
  6. 在“更新区域”对话框中,单击“检测细胞”,如附图所示。

表格单元格

如果这没有给您预期的结果,请将您正在测试的实际文件发送到 support@leadtools.com 并解释您是如何准确测试的。

于 2020-01-09T18:11:22.783 回答