问题标签 [docx]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
650 浏览

.net - 是否有可用于将 WordprocessingML 转换为 RTF 的 XSLT

我目前在 C# 中以编程方式生成 docx 文件。

我想将我的 doc 文件转换为 RTF。这可以通过 XSLT 转换来完成。是否有公开可用的转换?

我也有兴趣将 docx 转换为 PDF 和 HTML。

0 投票
7 回答
37188 浏览

c# - 我如何阅读 .docx 文件?

我有一个 .docx 文件,它包含许多我想批量发送邮件的电子邮件地址。如何通过 c# 读取 docx 文件?

0 投票
1 回答
434 浏览

xml - 如何在word模板中重复相似的字段?

我正在研究基于模板以编程方式编辑 Word 文档的领域。例如,如果模板中有一个我的地址部分,他们希望我过去的地址可以追溯到 5 年前,而我已经搬了 3 次,我将不得不输入 3 个地址。显然这里的字段完全相同,但我希望它们每个都有不同的值。处理这个问题的最佳方法是什么?我想在后端 XML 文档中我希望看到 Address1 Address2 Address3 等等,但并不是每个人都会有 3 个地址。我是否应该在模板中只有一个位置,并让我的代码为地址注入其他 XML 部分,基于模板进行硬编码?

0 投票
4 回答
4819 浏览

version-control - 版本控制压缩文件(docx、odt)

有些格式实际上是伪装的 zip 文件,例如 docx 或 odt。如果我将它们直接存储在版本控制中,它们将作为二进制文件处理。我理想的解决方案是

  • 有一个钩子,在提交之前foo.docx/为每个文件创建一个目录,将所有文件解压缩到其中foo.docx
  • 可选地,有一个重新缩进 xml 文件的钩子
  • 有一个钩子,foo.docx可以在更新后从存储的文件中重新创建

我不希望 docx 文件本身受版本控制。(我知道一个相关的问题,其中建议使用自定义差异的不同方法。)

这是可行的吗?这对 mercurial 可行吗?

更新:

我知道钩子。我对细节感兴趣。这是一个演示预期行为的会话。

0 投票
4 回答
25362 浏览

vim - 使用 Vim 编辑 Microsoft Word 文件

我找到了ViEmu,一个用于 microsoft word 的 vi 模拟器。但是,我想使用 vim 来编辑 DOC 甚至 rtf 文件。这可能吗 ?

它们是否保留了与 Microsoft Word 和 Vim 兼容的页面/段落布局的任何其他格式?我也对 OpenOffice 格式持开放态度。

0 投票
4 回答
1671 浏览

ms-word - docx / doc / rtf 与轻量级标记之间的转换

我正在寻找一种工具或一组工具来在文件格式 D 和 M 之间进行转换,其中

  • D是MSWord处理的格式,按优先顺序,docx, doc, rtf
  • M是轻量级标记,如markdown、textile、txt2tags,可以是深奥的
  • 有一种方法可以从 M 生成 html
  • 转换是双向的,既从 D 到 M,又从 M 到 D
  • utf-8 编码处理得当
  • 内容很简单,段落,一些简单的格式,如粗体和斜体,也许是列表
  • 这些工具独立于平台

到目前为止我发现了什么

  • TeX、LaTeX——太重量级了
  • docx2txt——太轻量级了,根本不支持格式化
  • html -- MSWord 生成臃肿的 html
  • 一些单向转换,例如doc 到 mediawiki

更新:

用例是技术人员和非技术人员之间的文档工作流

  • 我,技术人员以纯文本形式编辑文档,将其放入版本控制等。
  • 我将其发送给我的经理或其他非技术人员
  • 他们添加评论,使用他们的 Word 对其进行更改,然后将其发回给我
  • 我想简单地了解他们的更改,进行更改,将其放入版本控制中,而无需使用 Word
0 投票
3 回答
1684 浏览

c# - 在 C# .NET 中查看 docx 文件

我需要创建 C# .NET 解决方案来直接从数据库中查看 .docx 文件,而无需在硬盘上写入。什么是最可行的方法?

一种选择是将 docx 文件转换为 .mht 格式并以 blob 类型保存在数据库中。但是我找不到直接从数据库中查看它的方法。

另一种方法是将docx文件转换为.jpg文件,可以使用.NET中的picturebox控件直接从数据库中查看。采用的方法是首先将 docx 转换为 .mdi,然后再转换为 .tiff 格式(使用 Microsoft Image Writer),然后再转换为 jpeg。但这涉及到几个 IO 操作,这会降低解决方案的效率和可靠性。

如果有人知道改进上述选项的方法或任何新想法,将不胜感激。提前致谢 :)

0 投票
3 回答
5025 浏览

ruby-on-rails - 如何使用 nokogiri 和 ruby​​zip 编辑 docx

我正在使用 ruby​​zip 和 nokogiri 的组合来编辑 .docx 文件。我正在使用 ruby​​zip 解压缩 .docx 文件,然后使用 nokogiri 解析和更改 word/document.xml 文件的正文,但是每次我最后关闭 ruby​​zip 时它都会损坏文件并且我无法打开它或修复它。我在桌面上解压缩 .docx 文件并检查 word/document.xml 文件,内容已更新为我更改的内容,但所有其他文件都搞砸了。有人可以帮我解决这个问题吗?这是我的代码:

0 投票
4 回答
9817 浏览

c# - 将 docx 文件合并在一起,包括页眉、页脚和图片

我必须将多个 DOCX 文件(使用DocX Package创建)合并到一个大文件中。我已经设法合并多个文件,但我无法合并页眉和页脚(它们在文件、页面之间有所不同)。我已经尝试过DocX 包和 MS Office COM 互操作,它根本不想合并页眉/页脚。他们被跳过。

有没有人可以提供可行的解决方案?可以是任何东西(包括使用 PDFCreator COM、Interop 或DocX转换为 PDF )。

我还在 C# 中尝试过 PDFCreator Sample,它可以很好地将一个文档转换为 PDF,但我不知道如何向它提供多个文档,因此它会创建一个大 PDF。因此,如果有人可以提供一种好的(免费)方式,我们将不胜感激。

这就是我使用的:

0 投票
2 回答
2322 浏览

svn - Using propset svn:keywords on .docx files

I just found out this nice SVN option that would be very useful on our project, but yet again I'm having problems integrating it with word files, .docx to be exact.

I am using Tortoise client. If I create .txt file with $Rev$ content in it and put SVN property on it with Rev it works like a charm, in other words when I commit the change in the content of the file itself gets updated. When I use the same in .docx document, nothing happens. Has to be because it's not a textual file but binary?

Is there a way to integrate propset command for .docx files? People here don't have problems it seems, didn't work for me tho:( Click Ps: I also tried .doc files, same result.

Thanks for your replays.