1

PPT幻灯片示例。

我必须阅读 pptx 文件。在 reding 时,我将提取一些数据,但不是从幻灯片中提取所有数据。找到幻灯片样本。我能够读取除 {1,2,3} 选项数据之外的所有数据。我也想读

这是代码。

from pptx import Presentation

prs = Presentation(path_to_presentation)

# text_runs will be populated with a list of strings,
# one for each text run in presentation
text_runs = []

for slide in prs.slides:
   for shape in slide.shapes:
     if not shape.has_text_frame:
        continue
   for paragraph in shape.text_frame.paragraphs:
       for run in paragraph.runs:
           text_runs.append(run.text)
4

1 回答 1

0

幻灯片上的所有项目都是一种或另一种形状。唯一的例外是背景图像。

然而,从幻灯片布局中“继承”了形状业务。幻灯片布局中的项目(例如徽标)将以PowerPoint 呈现的方式直观地显示在幻灯片上,但不会包含在幻灯片的 XML 中,也不会出现在 slide.shapes 中。

要注意的另一件事是,PowerPoint 会出于各种原因分解文本运行,即使它们具有完全相同的格式。您不能确定它是否会在逻辑上保持单一运行。因此,根据您要查找的数据形式,您可能只想直接访问paragraph.text 并从那里解析内容。

当然,如果形状是图像(例如 1. 或 2.),它们将在视觉上显示为文本,但不会有文本框或任何文本。

于 2016-02-24T02:23:54.623 回答