1

首先,我同意这听起来像是一个过去已经被问过很多次的问题。但是我在类似问题中找不到任何与我相关的答案,所以我会尝试更具体。

我需要使用 Python 将 PPTX/DOCX 文件转换为 PDF,但我在文件格式转换方面没有任何经验。我一直在寻找很多地方/论坛/网站,阅读了很多文档并遇到了一些有用的库(主要是python-pptxpyPdf),但我仍然不知道从哪里开始。

在 Internet 上查看时,我可以看到许多提供文件格式转换作为付费服务的网站,即使使用高级 API 也是如此:通过 POST 提交文件并获得转换后的 PDF 文件作为回报。这可能对我有用,但我真的很想自己编写代码来完成从 OOXML 到 PDF 的转换工作。

你将如何开始这样做?还是仅靠我自己是不可能的?

谢谢你的帮助!

4

1 回答 1

2

经过一些研究并在 python-pptx 的创建者的帮助下,我能够使用虚拟机写入 PowerPoint COM 接口。

万一有人读到了这个帖子,这就是我设法完成这项工作的方法: - 设置一个安装了 Microsoft Windows/Office 的 VM;- 在 VM 上安装 Python、Django 和 win32com 库。

这些文件通过简单的 POST 请求从原始 Django 项目本地发送到虚拟机(位于同一网络上)。该文件在 VM 上使用 win32com.client 进行转换(这只是对 win32com.client 库的简单调用),然后作为对原始 Django 视图的响应发送回,后者依次处理响应。

注意:我花了一些时间才意识到我需要使用 @csrf_exempt 装饰器才能使此设置正常工作。

于 2013-08-30T12:37:08.320 回答