问题标签 [python-docx]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
322 浏览

python - 无法提取富文本---DOC、DOCX

问题:

我需要:

  • 用于从 doc/docx 文件中提取富文本的 Python 模块。

有任何想法吗?

0 投票
1 回答
6173 浏览

python - 如何在 mac osx 上安装 Python docx 模块

我正在尝试.docx使用 Python 生成文件。我在这里搜索了网络和帖子,发现了一个模块:

https://github.com/mikemaccana/python-docx/blob/master/README.markdown

它说使用easy_installor安装pip,我不知道该怎么做。我去 python 网站按照 python 文档中给出的说明安装 pip:

http://guide.python-distribute.org/installation.html

所以我下载并按照说明进行操作:

但是当我执行 python setup.py install 时,我收到错误消息:

有人可以帮我逐步安装新手吗?提前感谢您的所有帮助!

0 投票
3 回答
10400 浏览

python - python - TypeError:'dict'对象不可调用

我正在使用 python 库 docx:http: //github.com/mikemaccana/python-docx

我的目标是打开一个文件,替换某些单词,然后用替换写入文件。

我当前的代码:

` 但是我收到以下错误:

我不知道为什么会这样,但我认为这与 docx 模块有关。谁能解释为什么会这样?

谢谢

0 投票
0 回答
1484 浏览

python - 从python中的docx获取文本

如何从 python 中的 docx 文件中获取文本?最好,这会将其导入一个简单的字符串。显然可以忽略原始文件中的格式。

我了解 docx 文件(文本保存为的文件夹document.xml)的结构,但我想要一种提取文本的简单方法,而无需手动打开该文件夹、提取文件和提取段落标签。

我已经尝试过Python Docx(根据这个旧的 stackoverflow 问题),但每次都会出错:

0 投票
1 回答
1614 浏览

python - 如何使用 python-docx 更改表格内容和样式?

我找到了 python-docx,它看起来很聪明,但是我必须做一些没有很好记录的任务。

我需要打开一个 .docx 模板,其中包含一个表格,为先前创建的列表中存在的所有实例做广告,我必须在模板内的表格中对它们进行格式化。

0 投票
1 回答
602 浏览

python - 使用 Python-Docx 设置字体属性

我正在使用Python-docx模块以编程方式创建一个 word 文档。

我希望能够使我的标题居中,在我创建的表格中将某些单词变为粗体,并进行其他基本标记

不幸的是,阅读模块中的源代码并没有给我太多的指导。

我猜它与 docx 代码所基于的 lxml/etree 模块有关,但我对该库不太熟悉。有任何想法吗?

0 投票
3 回答
12866 浏览

python - Python Docx 回车

Python Docx是一个非常好的库,用于为不直接处理所有 COM 内容的东西生成 Microsoft Word 文档。尽管如此,我遇到了一些限制。

  • 有谁知道如何将回车符放入一串文本中?

我希望一个段落有多行,而它们之间没有额外的空间。但是,写出一个将行与通常行分开的字符串\n是行不通的。也不是使用&#10or &#13。还有其他想法,或者这个框架对于类似的东西来说太有限了吗?

0 投票
1 回答
5383 浏览

python - 使用 python-docx 跨越表格中多个列的单元格

我正在尝试使用python-docx模块创建一个看起来像这样的表。

我要创建的表的示例

从 example-makedocument.py 中创建表的示例代码并阅读 docx.py 中的代码,我认为类似的东西会起作用:

但是这会破坏 docx 文档,当 Word 恢复文档时,表格显示如下:

实际创建的表

如何使用 python-docx 让一行正确跨越多个列?

0 投票
2 回答
1836 浏览

python - 使用 python-docx 搜索和替换后丢失格式和图像

专家们,

我有一个模板 docx 报告,里面有图像和标准格式。我使用 docx 所做的只是搜索一些标签,并使用配置文件中的值替换它。

搜索和替换按预期工作,但输出文件丢失了所有图像和格式。你知道出了什么问题吗?我所做的只是修改 example-makedocument.py,并将其替换为我的 docx 文件。

我搜索了关于 python.docx librelist 的讨论,以及他们在 github 上的页面,有很多这样的问题,但仍未得到解答。

谢谢你。

--- 我的脚本很简单 ---

0 投票
1 回答
2682 浏览

python - python-docx - 如何控制字体和其他属性

我正在使用 python-docx 生成 .docx 文件。我希望能够控制要附加到文档正文的段落(以及其中的单个单词,如果可能的话)的样式。

生成段落的业务端是这样的:

body.append(paragraph("这是一个新段落"))

现在,我不熟悉 XML 的复杂性,老实说,学习足够多的知识来使用 lxml 解析和操作它对于我的想法来说太过分了。谁能提供一个简单的例子,比如将我上面段落的字体从默认更改为 Courier New?

这里有几个类似(但未回答)的问题,如果我弄错了,请为违反协议道歉。