我正在尝试从 PDF 文件中提取一些表格,这两个工具(Abbyy 和 Omnipage)在识别表格方面做得很好。但是在识别行和列时,它们都犯了同样的错误。
通常,当他们创建部分行时,问题就出现了,只水平拆分一个单元格,而不是其他单元格。有关我的意思的示例,请参见附图。在左侧的列中,一些单元格被分成两半,这使得表格在 Excel 中难以处理。
我发现这些程序一开始就这样做很奇怪,因为带有拆分单元格的表格总是很痛苦。
有没有办法告诉这些程序只设置完整的列和行,而不是拆分单个单元格?
对其他解决方案有什么建议吗?