xml - 在 XSL-FO 驱动 (Pdf) 中嵌入 Excel 文件 - 文档生成

Question

我们目前正在使用 XSL-FO 转换生成所有官方文档，使用 .xml 文件作为输入并生成 .pdf 文件，并且这些 .xml 文件中的所有内容基本上都是纯文本或 xhtml。这非常适合日常用例，但我们的一些用户引用了我们的 XSL-Fo 转换器（天线屋）无法原生处理的 Microsoft Excel 文件（而且，afaik，也没有其他人真正做到这一点）。

因此，作为中间的短期解决方案，我们所做或正在做的事情是，我们从用户定义的打印区域创建图像，并将这些图像嵌入到 .pdf 文件中。

然而，由于这些图像显然不是“可搜索”的内容，我们正在寻找 OCR 对这些 .pdf 等进行 OCR 的后处理步骤，但在我看来，这一切都深入到了解决方法的漏洞中。

我有将这些 .xls 文件转换为 SpreadsheetML 的想法，并用我们的 xsl-fo 样式表覆盖它，但是看着电子表格的规范，我也有点放弃了这个希望.. 至少没有在实施过程中投入几十个人工月。

那么，来回答我的实际问题，在 xsl-fo 驱动的文档生成中，您将如何处理 Microsoft Excel 文件？

干杯和感谢，-J

score 1 · Accepted Answer

您的 .xls 文件有公式吗？如果不只是使用 fo 中的表格、行和单元格标记将 xlsx 转换为 xsl-fo。从来没有在 xml 中查看过带有公式的 xlsx 文件。让我想知道您是否可以将 Excel 文档保存为“可见”而没有公式只是结果？有点像“打印到excel”？

score 0 · Accepted Answer

您可以将 Excel 文件转换为 PDF，然后合并生成的文档。它不是直接通过 XSL-FO 处理。

就个人而言，我什至不会尝试将 Excel 文件存储在 PDF 中，我会从 PDF 链接到它。Excel 是封闭的，非常复杂，对于开放的部分（新的 XML 格式），它仍然可以（通常）包含二进制 blob 及其移动目标。我不认为这是一场值得打的战争。

score 0 · Accepted Answer

Windward Docgen完全符合您的要求。使用 Windward，您可以在 Word、Excel 或 PowerPoint 中设计文档，然后我们的引擎将该模板与数据合并以创建最终文档。该引擎在 Java 和 .NET 中可用，并且不使用服务器上的 Office，因此速度非常快，并为您提供嵌入了 Excel 并评估所有宏的最终 PDF。（免责声明 - 我是 Windward 的 CTO。）

xml - 在 XSL-FO 驱动 (Pdf) 中嵌入 Excel 文件 - 文档生成

3 回答 3

Related

Reference