3

我想在 Linux 上使用 Python 打开一个 ppt 文件(就像 python 打开一个 .txt 文件一样)。我知道win32com,但我正在使用linux。那么,我需要做什么?

4

5 回答 5

1

使用odfpy项目中的 odf.opendocument.OpenDocumentPresentation。这是假设您只关心与 OpenDocument 标准兼容的最新格式文件。

如果您有权访问 OpenOffice,则可以使用他们的Python api来读取文件。

于 2012-11-26T05:34:55.997 回答
1

如果你在 Linux 上,你指的是什么办公软件。OpenOffice(无头)可以在 Linux 上使用 python 进行接口。这是一个很好的例子https://github.com/jledoux/FRIEDA

于 2012-11-26T05:35:51.003 回答
1

python-pptx可以在 Linux 上打开最近的 Powerpoint 版本。他们甚至在入门指南中提供了从幻灯片中提取所有文本的示例。

这是代码(来自入门指南)

from pptx import Presentation

prs = Presentation(path_to_presentation)

# text_runs will be populated with a list of strings,
# one for each text run in presentation
text_runs = []

for slide in prs.slides:
    for shape in slide.shapes:
        if not shape.has_textframe:
            continue
        for paragraph in shape.textframe.paragraphs:
            for run in paragraph.runs:
                text_runs.append(run.text)
于 2014-06-12T21:45:34.637 回答
0

使用带有子进程的 catdoc/catppt 打开 doc 文件和 ppt 文件。

于 2012-11-26T15:54:25.537 回答
-1

您可以检查 Apache Tika,因为我在 mac 上使用它是这样的

对于 MacOS Homebrew 用户:安装 Apache Tika ( brew install tika)

命令行界面的工作方式如下:

tika --text something.ppt > something.txt

并在 python 脚本中使用它:

import os
os.system("tika --text temp.ppt > temp.txt")

你将能够做到这一点,这是我迄今为止唯一的解决方案。

于 2017-09-27T18:59:09.240 回答