我需要使用 C# 将 PDF 文件转换为 .doc 文件。该计算机虽然没有安装 Office,但没有文件系统。有什么好的想法可以解决这个问题吗?我做了一些研究,大多数人都使用互操作服务。
问问题
1353 次
3 回答
0
一个选项/想法可能是将 PDF 转换为 Html,可以在 Word 中打开?
于 2011-04-22T18:37:07.503 回答
0
您需要了解 PDF 并没有真正实现为单一文档格式。
如果您的 PDF 文档是通过将文本呈现为 PDF 文件来创建的,那么直接 PDF 转换不仅是可能的,而且非常好(可靠)。
如果您的 PDF 的来源是扫描仪或传真(本质上是扫描仪......),那么您所拥有的是带有文本“图片”的文档。这种情况更难处理。如果您为此打开标记,则没有要转换的“文本”。在这种情况下,您必须处理由于各种问题而不太可靠的某种方式的 OCR(光学字符识别)。
如果您可以选择在数据呈现为 PDF 之前截取数据(比如在 SSRS 或 Crystal 中),那么您最好绕过 PDF 阶段并将数据移动到 Word 文档。
如果您受限于接收传真然后需要解释其内容,请为 OCR 地狱做好准备。自从我在那里已经有一段时间了,所以我希望它变得更好。
即使您的计算机上没有安装 Office,您也可以(使用 Visual Studios)访问 Office 开发人员工具包,该工具包允许您构建以 Word 格式分发的文档。(.doc/.docx)。
于 2011-04-22T18:50:05.140 回答
0
使用 aspose pdf 套件将 pdf 转换为文本,然后使用 filestream 或 aspose doc 将文本转换为 doc
于 2011-04-28T18:08:57.403 回答