我有一堆(10k+)文件,实际上不仅是 .doc,还有 .ppt 和 .xls 文件需要转换为 docx、pptx 和 xlsx。我要将这些文档上传到 SharePoint 并拥有一个带有 SharePoint、Visual Studio、Office 2010 Pro 等的环境。
是否有任何最佳实践来执行此操作?我一直在看 Aspose.Words,但 2500 美元似乎有点超出了一次性转换的上限。
我有一堆(10k+)文件,实际上不仅是 .doc,还有 .ppt 和 .xls 文件需要转换为 docx、pptx 和 xlsx。我要将这些文档上传到 SharePoint 并拥有一个带有 SharePoint、Visual Studio、Office 2010 Pro 等的环境。
是否有任何最佳实践来执行此操作?我一直在看 Aspose.Words,但 2500 美元似乎有点超出了一次性转换的上限。
您必须使用 microsoft interop dll,并且您需要拥有 ms office2007 或 2010。它或多或少是最安全的做法。但是正如您所说的 10K+ 文档,这将需要很多时间。这是一个三步过程。打开文件。另存为文件并关闭文件循环遍历所有文件。您可以借助答案中提供的链接。
您可以在 c# 中自动使用 Word(和 PowerPoint),看看这里作为起点,您可以在旧文件之间循环并以编程方式调用新格式的保存。
也许有用,
使用 PowerShell 将 DOC 转换为 DOCX
http://row5is.wordpress.com/2012/07/06/convert-doc-to-docx-using-powershell/
Basic Powershell - 将 Word Docx 批量转换为 PDF
http://kiquenet.wordpress.com/2014/02/20/convert-doc-office-97-2003-to-docx-office-2010/
恕我直言,它可以轻松移植到 C#。