我正在尝试使用 iText 来查找使用 java 的 pdf 文件中存在的表的数量,但是没有成功,任何人都可以让我知道正确的查看方向。
问问题
1058 次
1 回答
2
如果您的 PDF 被标记,您可以检查StructTreeRoot
表结构。如果您的 PDF 未标记,则您的 PDF 中没有表格。您可能用肉眼看到表格,但就 PDF 文件而言,只有行和文本片段,没有表格!
未标记的 PDF 对其结构一无所知!从不包含 a 的 PDF 中提取表格与StructTreeRoot
从胡萝卜汤中提取原始完整胡萝卜一样可能。如果那是您想要做的,那么希望我的比喻可以解释为什么您要寻求不可能的事情(这解释了为什么您找不到任何答案)。
如何确定 PDF 是否被标记?在 Adobe Reader 中打开 PDF,然后单击文件 > 文档属性。在“属性”选项卡底部的某处,有一个条目指示Tagged PDF: No或Tagged PDF: Yes。
于 2013-06-05T10:47:00.513 回答