问题标签 [python-docx]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
322 浏览

python - 当文档包含图像时,使用 python-docx 读取文本问题

我在从包含图像的文档中解析文本时遇到问题。

我在运行 Ubuntu 12.04.4 LTS(GNU/Linux 3.2.0-60-generic x86_64)的 Ubuntu Linux 机器上使用 0.7.0 版 Python docx

我正在使用这个逻辑:

```

```

当有图像时,此过程失败。

有什么我做错了吗?

0 投票
2 回答
5650 浏览

python - 从 lxml 导入 etree 时出现 libxml2 ImportError

我正在尝试在 Enthought Canopy 中运行 python-docx。我在 VMWare Worstation 10 上运行 Ubuntu 14.04。每当我尝试从 lxml 导入 docx 或导入 etree 时,我都会收到一个似乎与 libxml2 库有关的错误:

我检查了一下,发现另一个人有类似的错误,我按照指示进行操作。仍然没有运气。然后我意识到我的电脑上有 libxml2 版本 2.9.1。

这是否意味着我需要获取较旧的 2.9.0 版本的 libxml2,还是发生了其他事情?我可以用 apt-get 找到 2.9.1,但不是 2.9.0。在踏上这条路之前,我想这里有人可能有更好的主意。

谢谢!

0 投票
10 回答
116973 浏览

python - 如何使用python-docx替换Word文档中的文本并保存

同一页面中提到的 oodocx 模块将用户引至似乎不存在的 /examples 文件夹。
我已经阅读了 python-docx 0.7.2 的文档,以及我可以在 Stackoverflow 中找到的关于该主题的所有内容,所以请相信我已经完成了我的“功课”。

Python 是我唯一知道的语言(初学者+,可能是中级),所以请不要假设任何 C、Unix、xml 等知识。

任务:打开一个包含单行文本的 ms-word 2007+ 文档(为了简单起见),并将 Dictionary 中出现在该行文本中的任何“关键”词替换为其字典值。然后关闭文档,保持其他所有内容不变。

一行文字(例如)“我们将在海室中流连。”</p>

我在文档中没有看到任何允许我执行此操作的内容 - 也许它在那里,但我不明白,因为在我的级别上没有详细说明所有内容。

我已遵循此站点上的其他建议,并尝试使用该模块的早期版本(https://github.com/mikemaccana/python-docx),该版本应该具有“替换,advReplace 等方法”,如下所示:我打开python解释器中的源代码,并在末尾添加以下内容(这是为了避免与已安装的0.7.2版本冲突):

运行它会产生以下错误消息:

NameError:名称'coreprops'未定义

也许我正在尝试做一些无法完成的事情——但如果我错过了一些简单的事情,我会很感激你的帮助。

如果这很重要,我在 OSX 10.9.3 上使用 64 位版本的 Enthought's Canopy

0 投票
1 回答
1273 浏览

python - 使用 python-docx 库搜索字符串并替换

我想搜索一个单词并将其替换为表格。以下代码仅适用于字符串:

有没有办法用桌子代替它?

0 投票
7 回答
32299 浏览

python - 使用 python docx 合并 word 文档

我有几个单词文件,每个文件都有特定的内容。我想要一个片段来展示或帮助我弄清楚如何在使用 Pythondocx库时将单词文件组合到一个文件中。

例如,在 pywin32 库中,我执行了以下操作:

但是我需要在使用 Pythondocx库而不是win32.client

0 投票
2 回答
2511 浏览

python-docx - word文档的页数

python docx库中是否有计算文档页数的功能?

0 投票
0 回答
401 浏览

python - python-docx 安装不起作用

我正在尝试安装 python-docx 包但遇到问题...

如何安装 libxml2 和 libxslt 包?我从这里下载了软件包,ftp://xmlsoft.org/libxml2/python/ 但遇到了如下所示的安装问题...

0 投票
5 回答
11852 浏览

python-3.x - python-docx 插入点

我不确定我是否遗漏了任何明显的东西,但我没有找到任何关于如何在文档中的某个特定位置插入 Word 元素(例如表格)的文档?

我正在使用以下方法加载现有的 MS Word .docx 文档:

我的用例是获取文档中书签或部分的“位置”,然后继续在该点下方插入表格。

我正在考虑一个 API,它可以让我按照这些思路做一些事情:

我看到有计划实现类似于 MS Word API 的“范围”对象的东西,这将有效地解决这个问题。同时,有没有办法指示document对象方法在哪里插入新元素?

也许我可以粘贴一些 lxml 代码来找到一个节点并将其传递给这些 python-docx 方法?对此主题的任何帮助将不胜感激!谢谢。

0 投票
1 回答
236 浏览

python - 由于 linux 上出现未知错误,Python docx 安装无法正常工作

我正在尝试安装 pip install python-docx 但收到以下错误。为什么它不起作用?

0 投票
2 回答
12552 浏览

python - 如何遍历 python-docx 文档中的所有内容?

我正在使用python-docx将 Word docx 转换为自定义 HTML 等效项。我需要转换的文档有图像和表格,但我无法弄清楚如何在给定的运行中访问图像和表格。这就是我的想法...

...但我没有看到任何关于orRun的信息。我必须直接回退到 XML 还是有更好、更简洁的方法来迭代文档中的所有内容?InlineShapeTable

谢谢!