1

我们目前正在使用 XSL-FO 转换生成所有官方文档,使用 .xml 文件作为输入并生成 .pdf 文件,并且这些 .xml 文件中的所有内容基本上都是纯文本或 xhtml。这非常适合日常用例,但我们的一些用户引用了我们的 XSL-Fo 转换器(天线屋)无法原生处理的 Microsoft Excel 文件(而且,afaik,也没有其他人真正做到这一点)。

因此,作为中间的短期解决方案,我们所做或正在做的事情是,我们从用户定义的打印区域创建图像,并将这些图像嵌入到 .pdf 文件中。

然而,由于这些图像显然不是“可搜索”的内容,我们正在寻找 OCR 对这些 .pdf 等进行 OCR 的后处理步骤,但在我看来,这一切都深入到了解决方法的漏洞中。

我有将这些 .xls 文件转换为 SpreadsheetML 的想法,并用我们的 xsl-fo 样式表覆盖它,但是看着电子表格的规范,我也有点放弃了这个希望.. 至少没有在实施过程中投入几十个人工月。

那么,来回答我的实际问题,在 xsl-fo 驱动的文档生成中,您将如何处理 Microsoft Excel 文件?

干杯和感谢,-J

4

3 回答 3

1

您的 .xls 文件有公式吗?如果不只是使用 fo 中的表格、行和单元格标记将 xlsx 转换为 xsl-fo。从来没有在 xml 中查看过带有公式的 xlsx 文件。让我想知道您是否可以将 Excel 文档保存为“可见”而没有公式只是结果?有点像“打印到excel”?

于 2009-02-03T21:09:19.130 回答
0

您可以将 Excel 文件转换为 PDF,然后合并生成的文档。它不是直接通过 XSL-FO 处理。

就个人而言,我什至不会尝试将 Excel 文件存储在 PDF 中,我会从 PDF 链接到它。Excel 是封闭的,非常复杂,对于开放的部分(新的 XML 格式),它仍然可以(通常)包含二进制 blob 及其移动目标。我不认为这是一场值得打的战争。

于 2008-11-27T01:14:19.560 回答
0

Windward Docgen完全符合您的要求。使用 Windward,您可以在 Word、Excel 或 PowerPoint 中设计文档,然后我们的引擎将该模板与数据合并以创建最终文档。该引擎在 Java 和 .NET 中可用,并且不使用服务器上的 Office,因此速度非常快,并为您提供嵌入了 Excel 并评估所有宏的最终 PDF。(免责声明 - 我是 Windward 的 CTO。)

于 2011-02-18T15:58:29.803 回答