1

我正在开发一个应用程序,我需要将 .docx 和 .pdf 文件转换为具有基本格式的 .txt 文件。我在互联网上搜索了它,但找不到任何免费的第三方 dll。任何人都可以建议我最好的方法和一些 dll 参考。

提前致谢

4

2 回答 2

1

http://support.microsoft.com/kb/316383很好地描述了您想要对 .docx 文件执行的操作。 http://visualbasic.about.com/od/quicktips/qt/disppdf.htm描述相同,但使用 .pdf 文件。

将文件读入代码后,使用 VB.NET 的内置文件写入功能输出到 txt 文件。

于 2012-07-30T14:01:25.040 回答
0

下面的代码将为您处理这项工作。这是我为大老板写的哈哈。我希望它有所帮助。该代码将工作表中的第一个单元格读取为存在 docx 文件的文件夹,然后将它们一个一个转换为 txt 文件并保存在同一文件夹中。

Const wdFormatText = 2

If Not Len(Cells(1, "A").Value) > 0 Or Dir(Cells(1, "A").Value, vbDirectory) = "" Then
    MsgBox ("Invalid Folder")
    Exit Sub
End If

Dim StrFile As String

    StrFile = Dir(Cells(1, "A").Value & "\*.docx")
    Do While Len(StrFile) > 0
        Set objWord = CreateObject("Word.Application")
        Set objDoc = objWord.Documents.Open(Cells(1, "A").Value & "\" & StrFile, False, True)
        objDoc.SaveAs Cells(1, "A").Value & "\" & StrFile & ".txt", wdFormatText
        objWord.Quit
        StrFile = Dir
    Loop
于 2017-12-18T08:21:52.320 回答