2

我正在开发一个 WebApp,在其中我将发票从 PDF 转换为 HTML,然后解析发票行。

我的div主窗口中有一个显示内容的窗口。

但是当我显示发票中的内容时div,所有内容都出现重叠。

转换后的发票中没有表格,只有divs绝对定位。至少用这种方法我不能用其他任何方式,因为这就是转换器的工作方式。

因此,作为一种解决方案,我正在从“div 到 table”转换,试图根据相应 div 的 top 参数来决定行是否发生变化。

但是,除了发票数据之外,我还有发票抬头。我很难确定桌子是否相同。

但到目前为止,我认为解决方案是通过制作 3 张表格,一张用于公司徽标,一张用于表头,一张用于数据。

但我需要所有这些表格出现在正确的位置和正确的尺寸。

目前,我不允许粘贴发票示例,因为我处于早期阶段(接近算法阶段)。我认为我的代码和发票的任何示例都不能帮助任何人更好地了解情况。

但我保证很快就会用例子来更新它。

作为替代解决方案,我可以自己解析 PDF,但到目前为止我还没有找到方法。

我正在使用 PHP 制作 WebApp 并使用verypdf pdf2html 进行转换。

我知道只有这么少的信息,很难得到帮助。

欢迎任何想法。

4

1 回答 1

0

如何尝试治愈重叠本身。例如,您可以在将 PDF 解析为 DIV 后从 DIV 中删除所有样式信息。然后,您可以应用自己的样式。了解所有发票是否采用相同的格式/排列可能很有用。

于 2013-04-12T14:45:33.243 回答