0

我正在尝试从 PDF 文件中提取一些表格,这两个工具(Abbyy 和 Omnipage)在识别表格方面做得很好。但是在识别行和列时,它们都犯了同样的错误。

通常,当他们创建部分行时,问题就出现了,只水平拆分一个单元格,而不是其他单元格。有关我的意思的示例,请参见附图。在左侧的列中,一些单元格被分成两半,这使得表格在 Excel 中难以处理。

我发现这些程序一开始就这样做很奇怪,因为带有拆分单元格的表格总是很痛苦。

有没有办法告诉这些程序只设置完整的列和行,而不是拆分单个单元格?

对其他解决方案有什么建议吗?

在此处输入图像描述

4

1 回答 1

1

ABBYY 有很多 OCR 产品,可配置的有 FineReader Engine 和 FlexiLayout Studio。其他 ABBYY 产品没有要求的设置。

于 2016-04-18T04:13:59.897 回答