我有一个 .docx 文件,它包含许多我想批量发送邮件的电子邮件地址。如何通过 c# 读取 docx 文件?
7 回答
最简单的方法可能是使用Open XML SDK 2.0
获取Visual Studio 2008 的代码片段以获取一些示例
我强烈推荐下载 Open XML SDK 生产力工具,它可以帮助您了解 Open XML 文件的结构,甚至可以帮助您根据文档结构生成与 SDK 一起使用的源代码。您可以从与 SDK 相同的页面下载该工具。它有 100MB,但值得下载。
您可以通过 Interop 读取 Microsoft Office 文件,也可以通过 Open XML 读取 Office >2007 文件:
- 互操作:http : //blogs.techrepublic.com/howdoi/ ?p=190
- 打开 XML: http: //msdn.microsoft.com/en-us/library/bb656295 (office.12).aspx
是的,我知道这是一篇非常古老的帖子,但这些信息可能会对正在搜索论坛的其他人有所帮助。
使用Sourceforge 的这个库。添加对该库的引用,然后:
Code7248.word_reader.TextExtractor extractor = new TextExtractor(filePath);
string contents = extractor.ExtractText();
docx 文件实际上是档案。
您可以将它们解压缩到它们的复合 XML 文件中,并阅读相关的 XML 文件 (file.docx\word\document.xml)) 并提取电子邮件地址。
该库将帮助您解压缩存档:.Net Zip Library
Office 2007 及更高版本遵循 OpenXML 格式。您需要 Packaging API 来打开和读取文档部分
http://msdn.microsoft.com/en-us/library/system.io.packaging.aspx
有免费的方式来阅读 doc 和 docx 文件,它可以帮助你。
Document doc = new Document();
doc.LoadFromFile("yourfile.docx");