问题标签 [docx]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
1098 浏览

asp.net - 如何在 ASP.NET 应用程序中查询 Word docx?

我想将 Word 2007 或更高版本的 docx 文件上传到我的 Web 服务器,并将目录转换为简单的 xml 结构。使用传统 VBA 在桌面上执行此操作似乎很容易。查看用于创建 docx 文件的 WordprocessingML XML 数据令人困惑。有没有办法(没有 COM)以更面向对象的方式导航文档?

0 投票
5 回答
3447 浏览

html - 将 doc/docx 转换为语义 HTML

我想将 doc/docx 文档转换为语义 HTML。

一些愿望/要求:

  1. 语义 HTML,例如文档中的标题是 <h1>、<h2> 等,表格是 <table> 等等。

  2. 最好能处理标题、列表、表格和图像。图表和数学公式是一个不错的附加功能。

• 不必直接从 doc/docx 转换为 html,可以使用中间格式,例如 xml 或 docbook。

• 应该以编程方式工作,并处理大量文档。

到目前为止,我找到的最接近解决方案的是http://holloway.co.nz/docvert/index.html,但不幸的是有很多错误,用户群很小,它无法处理很多文件。更多的是概念证明。

0 投票
5 回答
9383 浏览

asp.net - 您是否有任何免费的 .Net 托管代码用于将 DocX 转换为 PDF?

在我的 Web 项目中,我使用 DocX 文件类型来包含报告模板。我需要将 DocX 文件类型转换为 PDF。您有任何 .Net 托管代码来执行此操作吗?

我知道解决这个问题的几种方法。但它不是托管代码,并且像以下项目一样免费。

  • Word 12.0 对象库以编程方式将 Word 2007 文档另存为 PDF 文档或 XPS 文档。但它需要在服务器上安装 Office 2007。

  • 使用一些免费的 PDF 打印机(如PDFCreator )进行打印。但是我需要一些程序来在 Office 2007 等服务器上打开 DocX。这是个非常糟糕的主意。

  • 通过免费的转换器程序进行转换。但结果并不完美。

  • 使用XF Rendering Server 之类的框架。这是个好主意,但它不是免费的。

  • 在 PDF Api 中创建所有文档内容,例如iTextSharp。但我必须努力创建好的文档。

  • 或者创建具有其他文件格式的模板文档,可以将其导出为 DocX 和 PDF 文件格式。此外,最终用户应轻松编辑此文件。如果你知道,请告诉我。

谢谢,

0 投票
4 回答
38939 浏览

c# - 如何替换模板 docx 文档和 Open XML SDK 2.0(8 月 9 日)中的内容?

我有一个包含所需布局的“模板”docx 文档,并希望使用 C# 插入内容,但我找不到唯一解决文档特定部分的方法,例如段落或表格。唯一标识文档中元素的最佳方法是什么?谢谢,马特夏普。

0 投票
1 回答
5286 浏览

excel - 将 docx 转换为 xlsx

我正在编写在 docx 中生成报告的 .NET 应用程序。我得到的最后一个要求是 - 还以 xlsx 格式生成这些报告。那么,有没有什么简单的方法可以将 docx 转换为 xlsx 格式呢?我还没有找到任何解决方案或实用程序/库。其中一个想法是使用 Microsoft.Office.Interop 复制/粘贴方法,但我不知道它是否有帮助:)

0 投票
2 回答
15663 浏览

docx - 如何使用 Apache POI 3.5 中新的 OOXML 支持从 DOCX 文件中提取纯文本?

2009 年 9 月 28 日,Apache POI 项目发布了 3.5 版,正式支持 Office 2007 中引入的 OOXML 格式,如 DOCX 和 XLSX。

请提供一个代码示例,用于以纯文本格式提取 DOCX 文件的内容,忽略任何样式或格式。

我问这个是因为我找不到任何涵盖新 OOXML 支持的 Apache POI 示例。

0 投票
6 回答
9784 浏览

c# - 将 TEX 文件转换为 PDF 或 DOCX?

我正在使用 Doxygen 从 C# 源代码构建 API 库。Doxygen 生成一个 TEX 文件库。

我的客户要求提供此 API 库的 PDF 版本,因此我需要将 TEX 文件库转换为单个 PDF 或 DOCX。

我一直在研究 LyX、OpenOffice 和 ProText 等工具,但仍未找到解决方案。

欢迎所有建议。

0 投票
3 回答
700 浏览

ms-word - 将 Word Doc 添加到 CVS - 已损坏

我正在使用 CVSNT。我将 Microsoft 2007 docx 文件“作为文本”添加到存储库中。提交后和更新之前,我尝试再次打开文件但无法打开。它说它是腐败的。

我尝试使用office word doc recovery,但无法恢复文档。

据我了解,我应该将单词 doc 添加为二进制文件而不是文本。我的错。

不幸的是,我的 word doc 仍然是腐败的。有没有办法把它找回来?

0 投票
2 回答
2053 浏览

.net - XPS 到 Doc(x) 通过 .Net 转换?

有谁知道将 xps 文档转换为 docx 或最终转换为普通(非 wordml).doc 的(本机).net 方法?就像不使用办公自动化,而是使用一些可能对我有帮助的本地(第 3 方).net 库?

基本上 xps > doc 转换将在具有多个同时运行的“作业”的服务器上进行,自动化办公室已被证明是 somehwat .. flakey ...

有人知道这样的库吗?

0 投票
4 回答
13619 浏览

xml - 如何将 WordprocessingML 文件夹压缩到可读的 docx 中

我一直在尝试编写一个简单的 Markdown -> docx 解析器/编写器,但我完全坚持最后一部分,这应该是最简单的:即将文件夹压缩为 Word 或任何其他 .docx 阅读器将认出。

我的解析器编写器真的无关紧要:如果我简单地解压缩任何旧的 Word 生成的 *.docx,然后尝试使用通常的压缩实用程序重新压缩它,给它一个文件结尾的 docx,我就会遇到这个问题。是否应该添加一些神秘的标头,或者我需要一个特殊的 OPC 压缩实用程序,还是什么?

我不是很想要一个可以做到这一点的工具,而是想弄清楚应该有什么。它似乎独立于 WordprocessingML 规范。

不用说我对压缩一无所知。我可以通过 Google 找到的所有东西都与您可以在业务中使用的精美实用程序有关,但我正在制作一个小可执行文件,它可能是 GPLd 或其他东西,并且应该适用于任何东西。