问题标签 [docx]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
asp.net - 如何在 ASP.NET 应用程序中查询 Word docx?
我想将 Word 2007 或更高版本的 docx 文件上传到我的 Web 服务器,并将目录转换为简单的 xml 结构。使用传统 VBA 在桌面上执行此操作似乎很容易。查看用于创建 docx 文件的 WordprocessingML XML 数据令人困惑。有没有办法(没有 COM)以更面向对象的方式导航文档?
html - 将 doc/docx 转换为语义 HTML
我想将 doc/docx 文档转换为语义 HTML。
一些愿望/要求:
语义 HTML,例如文档中的标题是 <h1>、<h2> 等,表格是 <table> 等等。
最好能处理标题、列表、表格和图像。图表和数学公式是一个不错的附加功能。
• 不必直接从 doc/docx 转换为 html,可以使用中间格式,例如 xml 或 docbook。
• 应该以编程方式工作,并处理大量文档。
到目前为止,我找到的最接近解决方案的是http://holloway.co.nz/docvert/index.html,但不幸的是有很多错误,用户群很小,它无法处理很多文件。更多的是概念证明。
asp.net - 您是否有任何免费的 .Net 托管代码用于将 DocX 转换为 PDF?
在我的 Web 项目中,我使用 DocX 文件类型来包含报告模板。我需要将 DocX 文件类型转换为 PDF。您有任何 .Net 托管代码来执行此操作吗?
我知道解决这个问题的几种方法。但它不是托管代码,并且像以下项目一样免费。
Word 12.0 对象库以编程方式将 Word 2007 文档另存为 PDF 文档或 XPS 文档。但它需要在服务器上安装 Office 2007。
使用一些免费的 PDF 打印机(如PDFCreator )进行打印。但是我需要一些程序来在 Office 2007 等服务器上打开 DocX。这是个非常糟糕的主意。
通过免费的转换器程序进行转换。但结果并不完美。
使用XF Rendering Server 之类的框架。这是个好主意,但它不是免费的。
在 PDF Api 中创建所有文档内容,例如iTextSharp。但我必须努力创建好的文档。
或者创建具有其他文件格式的模板文档,可以将其导出为 DocX 和 PDF 文件格式。此外,最终用户应轻松编辑此文件。如果你知道,请告诉我。
谢谢,
c# - 如何替换模板 docx 文档和 Open XML SDK 2.0(8 月 9 日)中的内容?
我有一个包含所需布局的“模板”docx 文档,并希望使用 C# 插入内容,但我找不到唯一解决文档特定部分的方法,例如段落或表格。唯一标识文档中元素的最佳方法是什么?谢谢,马特夏普。
excel - 将 docx 转换为 xlsx
我正在编写在 docx 中生成报告的 .NET 应用程序。我得到的最后一个要求是 - 还以 xlsx 格式生成这些报告。那么,有没有什么简单的方法可以将 docx 转换为 xlsx 格式呢?我还没有找到任何解决方案或实用程序/库。其中一个想法是使用 Microsoft.Office.Interop 复制/粘贴方法,但我不知道它是否有帮助:)
docx - 如何使用 Apache POI 3.5 中新的 OOXML 支持从 DOCX 文件中提取纯文本?
2009 年 9 月 28 日,Apache POI 项目发布了 3.5 版,正式支持 Office 2007 中引入的 OOXML 格式,如 DOCX 和 XLSX。
请提供一个代码示例,用于以纯文本格式提取 DOCX 文件的内容,忽略任何样式或格式。
我问这个是因为我找不到任何涵盖新 OOXML 支持的 Apache POI 示例。
c# - 将 TEX 文件转换为 PDF 或 DOCX?
我正在使用 Doxygen 从 C# 源代码构建 API 库。Doxygen 生成一个 TEX 文件库。
我的客户要求提供此 API 库的 PDF 版本,因此我需要将 TEX 文件库转换为单个 PDF 或 DOCX。
我一直在研究 LyX、OpenOffice 和 ProText 等工具,但仍未找到解决方案。
欢迎所有建议。
ms-word - 将 Word Doc 添加到 CVS - 已损坏
我正在使用 CVSNT。我将 Microsoft 2007 docx 文件“作为文本”添加到存储库中。提交后和更新之前,我尝试再次打开文件但无法打开。它说它是腐败的。
我尝试使用office word doc recovery,但无法恢复文档。
据我了解,我应该将单词 doc 添加为二进制文件而不是文本。我的错。
不幸的是,我的 word doc 仍然是腐败的。有没有办法把它找回来?
.net - XPS 到 Doc(x) 通过 .Net 转换?
有谁知道将 xps 文档转换为 docx 或最终转换为普通(非 wordml).doc 的(本机).net 方法?就像不使用办公自动化,而是使用一些可能对我有帮助的本地(第 3 方).net 库?
基本上 xps > doc 转换将在具有多个同时运行的“作业”的服务器上进行,自动化办公室已被证明是 somehwat .. flakey ...
有人知道这样的库吗?
xml - 如何将 WordprocessingML 文件夹压缩到可读的 docx 中
我一直在尝试编写一个简单的 Markdown -> docx 解析器/编写器,但我完全坚持最后一部分,这应该是最简单的:即将文件夹压缩为 Word 或任何其他 .docx 阅读器将认出。
我的解析器编写器真的无关紧要:如果我简单地解压缩任何旧的 Word 生成的 *.docx,然后尝试使用通常的压缩实用程序重新压缩它,给它一个文件结尾的 docx,我就会遇到这个问题。是否应该添加一些神秘的标头,或者我需要一个特殊的 OPC 压缩实用程序,还是什么?
我不是很想要一个可以做到这一点的工具,而是想弄清楚应该有什么。它似乎独立于 WordprocessingML 规范。
不用说我对压缩一无所知。我可以通过 Google 找到的所有东西都与您可以在业务中使用的精美实用程序有关,但我正在制作一个小可执行文件,它可能是 GPLd 或其他东西,并且应该适用于任何东西。